Op zoek naar state-of-the-art slimme tools: het proces

Aan de start van onze zoektocht naar mogelijke artificiële intelligentie-tools, die het onderzoeksteam kan integreren in het nieuwe newsroom computer system (NRCS), hebben we een brede blik geworpen op de bestaande markt.

Vervolgens hebben we vanuit die kennis mogelijke AI-tools bestudeerd die de redactionele werking kunnen ondersteunen. De lessen uit dat onderzoek gebruiken we vervolgens voor de integratie van enkele AI-tools in het EPIC-NRCS. Dat is, in een notendop, hoe we aan de slag gegaan zijn met het marktonderzoek.

AI-integratie in bestaande systemen

In een eerste stap hebben we onderzoek gedaan naar slimme tools die al op de markt aanwezig zijn. Daarbij hebben we enerzijds gekeken welke AI bestaande Newsroom Computer Systemen al gebruiken en anderzijds naar de individuele tools die reeds op de markt zijn.

Voor dit onderzoek hebben we de documentatie van bestaande redactiesystemen doorgenomen. Enkele voorbeelden: het Noorse Wolftech, het Zweedse NXT Edition, het Noorse Dina en het Tsjechische Octopus. Van enkele redactiesystemen heeft het onderzoeksteam, onder leiding van de consortiumpartner Bruzz, vervolgens enkele demo’s aangevraagd.

ChatGPT (en OpenAI) blijkt een geprefereerde partner voor heel wat NRCS
Foto door Sanket Mishra via Pexels

Hierbij leerden we dat heel wat redactiesystemen reeds AI-technologie integreren en daarnaast AI-connectoren aanbieden waarmee redacties zelf extra AI-tools kunnen toevoegen. Zo integreert Octopus 12 standaard ChatGPT met een aantal vooraf ingestelde prompts voor tekstoptimalisatie en samenvattingen, opzoekwerk en factchecking. Bij NXT Edition zagen we dan weer een integratie van Open AI’s Whisper in hun software voor spraak-naar-tekst-opdrachten. Dina koos voor een belangrijke integratie met Mimir en biedt op die manier onder andere transcripties, vertalingen en metadata logging aan.

Slimme AI-tools in een journalistieke context

Voor dit deel van het onderzoek hebben we de bestaande markt van slimme tools opgedeeld volgens de verschillende stappen in het redactionele nieuwsproductieproces: research, creatie, verificatie, distributie, personalisatie, categorisering, analyse. Deze categorieën weerspiegelen de verschillende stadia van het nieuwsproductieproces – van het genereren van inhoud tot het analyseren van de prestaties en het optimaliseren van de distributie.

We hebben daarbij vooral gezocht naar slimme tools en AI-technologie die nieuwsredacties ondersteunen en zo’n redactie helpt om de productiviteit en de efficiëntie te verhogen, de kwaliteit en de relevantie van nieuws te verbeteren en de betrokkenheid en de interactie met het publiek te vergroten.

Uiteindelijk hebben we ons verdiept in vier categorieën: Research, Creatie, Verificatie en Categorisering. Hierbinnnen maakten we een quick scan van zo’n 70 tools. Die tools werden in een matrix per categorie gegoten (zie hieronder).

Een screenshot van de matrix
Foto: EPIC

Daarbij hebben we telkens een eerste antwoord gezocht op de volgende vragen:

  • Wat steek je in de tool en wat komt er uit (vb. omzetting van audio naar tekst bij transciptie-tools)?;

  • Waar in het journalistieke productieproces kan je de tool inzetten? Als taalondersteuning, bij beeldcreatie, als researchtool?;

  • Welke talen worden ondersteund door de tool? Hierbij heeft het onderzoeksteam extra aandacht geschonken aan Frans en Nederlands;

  • Welke integratiemogelijkheden biedt de tool? Is er een API, een websiteplug-in, … ?;

  • Wat is de kostprijs voor het gebruik van de tool? Werkt het met licenties of eenmalige betalingen?;

  • Hoe zit het met GDPR en privacy? Hoe gaat de tool om met de content die je oplaadt, waar wordt deze bewaard en hoe wordt die gebruikt?;

  • Welke referenties kan de tool voorleggen? Wordt het al door andere media en NRCS gebruikt?;

  • Hoe lang bestaat de tool al? Tijdens het zoekproces kwamen we regelmatig tools tegen die veelbelovend waren maar die een paar maanden later niet meer beschikbaar waren of een andere weg ingeslagen waren.

Tijdens deze quick scan vielen al een groot aantal tools uit de boot. De reden was telkens simpel: ofwel ondersteunden ze geen Nederlands of Frans, ofwel boden ze beperkte integratiemogelijkheden, ofwel lag de kostprijs te hoog.

Een aantal tools bleken wel interessant voor journalisten, maar pasten niet binnen de context van een redactiesysteem. Om die reden hebben we onze eerste selectie opgesplitst in een selectie van tools die potentieel hadden om geïntegreerd te worden binnen een NCRS en een selectie van tools die voor de individuele journalist interessant zijn ter ondersteuning van zijn journalistieke werk.

Na de quick scan bleven er zo 20 slimme en AI-tools over voor ons nieuw te bouwen redactiesysteem en 15 tools voor de journalist.

De lijst van 20 tools werd voorgelegd aan de consortiumpartners en verder teruggebracht tot 10 tools die grondiger getest werden. Doen de tools wat ze beloven? Kunnen ze ook daadwerking geïntegreerd worden in het nieuwe NRCS en vooral ook, hoe zit het met privacy en GDPR?

De screening van dat laatste criterium heeft consortiumpartner AContrario voor zijn rekening genomen. Zij zijn immers een expert inzake de GDPR en intellectual property (IP). De andere onderzoekspartners hebben dan weer de andere criteria onder de loep genomen.

Enkele learnings

Uit het marktonderzoek leerden we vooral dat…

  • het correct ondersteunen van het Nederlands een uitdaging is voor AI-tools;

  • de markt van AI-technologie enorm snel evolueert en je steeds achter de feiten aanholt;

  • het niet altijd duidelijk is hoe er met de ingegeven informatie wordt omgegaan (gdpr) en hoe het creatieproces van de AI-tool tot stand kwam;

  • veel bestaande software waarmee journalisten dagelijks mee werken al AI-technologie geïntegreerd heeft. Denk aan beeldbewerking en transcriptie in veel videosoftware;

  • een nieuw NRCS moet inspelen op tools die naast deze geïntegreerde en bestaande AI-tools een meerwaarde kunnen bieden binnen het NRCS;

  • voor elke AI-technologie de afweging moet gemaakt worden hoe deze matcht met de journalistieke deontologie.