Vi lever i en tid der kunstig intelligens brukes til å overta utallige oppgaver som tidligere var forbeholdt mennesker - alt fra å konkurrere på Jeopardy! å svare på telefoner ved kundesentre. Nå er en ny teknologi sikker på å slå frykten inn i hjertet til enhver journalist, reporter eller blogger. Det utvikles programvare som kan bruke rå data - for eksempel Twitter-feeds, inntektsrapporter fra selskapet og baseball box-score - for automatisk å produsere nyhetsartikler som virker som om de er skrevet av et virkelig levende menneske. For bedre eller verre, velkommen til den modige nye verdenen av datastyrt journalistikk.
Det mest fremtredende eksemplet er en oppstart kalt Narrative Science, som har skapt bølger (og samlet inn $ 6 millioner dollar i kapital) ved å banebrytende dataprogramvare som analyserer disse slags datasett og skriver alt fra aksjeråd til sportsanalyse.
Tidligere innsats fra andre programmerere for å automatisere journalistikk førte til formelartikler, uoverensstemmende artikler. Men Narrative Sciences medarbeidere, Kris Hammond og Larry Birnbaum fra Northwestern Universitys intelligente informasjonslaboratorium, har utviklet algoritmer som kan gjøre noen bemerkelsesverdige ting. Programvaren kan for eksempel tolke rute for å bestemme en passende vinkel for en spilloppsummering, skille mellom en utblåsning, en komme bak seier eller et nært tap.
Nylig har programvaren blitt brukt til å analysere tweets om politiske kandidater, og bemerket at Newt Gingrich vakte positiv offentlig oppmerksomhet ved å fokusere på skattespørsmål, men fikk også betydelig kritikk på karakterspørsmål. Fremtidig bruk, antyder selskapet, kan inkludere artikler om datasett som kriminalitetsstatistikk, resultater av medisinsk studie og undersøkelser.
Forfatteren leser kanskje ikke som poesi, men det får poenget i språket som er mindre stylet enn du kanskje forventer, og vil sannsynligvis lure leserne uvitende om at et program skrev artikkelen. I bloggen sin, Just to Clarify, skriver Hammond at selskapet bruker en redaksjon med ekspertise på området for manuelt å konfigurere motoren for hver type data. Programvaren er proprietær, så offentlig tilgjengelige detaljer om hvordan systemet fungerer er noe vage, men Hammond sier at dens evne til subtilt å etterligne den menneskelige stemmen forbedrer seg hele tiden.
Selv om de fleste av selskapets 30 eller flere kunder bruker tjenesten for interne notater - og antagelig, de fleste nyhetsorganisasjoner foretrekker å holde stille om sine robotskrevne artikler - er det allerede flere eksempler på publiserte artikler som ble skrevet med programvaren. En liten del av Forbes.com inneholder artikler med byline "Narrative Science." The Big Ten Network har brukt programvaren til å publisere nesten øyeblikkelig gjenopptak sekunder etter at spillene er avsluttet. Og Hanley Wood, et forlag for byggebransjen, har ansatt Narrative Science for å gre gjennom data om boligtrender og publisere artikler på nettstedet sitt, builderonline.com.
Hva er konsekvensene av denne trenden? Vel, hvis programvaren forbedres til det punktet at den konkurrerer med menneskers arbeid, kan den teoretisk sett overgå tradisjonell journalistikk, siden kostnadene er så mye lavere. I fjor høst ble det rapportert at Hanley Wood betalte omtrent $ 10 for hver 500-orders artikkel - mye mindre, av de fleste estimater, enn kostnadene for å betale faktiske forfattere.
Dommersagere kan advare om at dette gir slutten på journalistikken slik vi kjenner den - begynnelsen på en verden der nyhetene våre kommer til oss uberørt av menneskelige hender og hærer av sinte forfattere er ute av arbeid. Narrative Science antyder imidlertid at programvaren deres er mest nyttig for små selskaper som ønsker å utvide eller berike dekningen av et tidligere oversett område.
Vi er ikke sikre på hvem vi skal tro. Vi kan bare love deg en ting: Denne artikkelen ble skrevet av et virkelig levende menneske.