https://frosthead.com

Hvordan avdekket datamaskiner JK Rowlings pseudonym?

En kjent britisk forfatter blir avslørt for å være forfatteren av en uklar mysterieroman. En innvandrer får asyl når myndighetene bekrefter at han skrev anonyme artikler som er kritiske for hjemlandet. Og en mann er dømt for drap når han er koblet til meldinger malt på forbrytelsesstedet.

Det vanlige elementet i disse tilsynelatende forskjellige sakene er "rettsmedisinske språkvitenskap" - en undersøkelsesteknikk som hjelper eksperter med å bestemme forfatterskap ved å identifisere påfunn i en forfatterstil. Fremskritt innen datateknologi kan nå analysere tekst med stadig finere nøyaktighet. Tenk på den nylige utflukten av Harry Potter-forfatteren JK Rowling som forfatteren av The Cuckoo's Calling, en kriminalroman hun ga ut under pennenavnet Robert Galbraith. Englands Sunday Times, som reagerte på et anonymt tips om at Rowling var bokens virkelige forfatter, leide Duquesne Universitys Patrick Juola til å analysere teksten til Cuckoo ved å bruke programvare som han hadde brukt i løpet av et tiår på å raffinere. En av Juolas tester undersøkte sekvenser av tilstøtende ord, mens en annen zoomet inn på sekvenser med tegn; en tredje test oppsummerte de vanligste ordene, mens en fjerde undersøkte forfatterens preferanse for lange eller korte ord. Juola ble avviklet med et språklig fingeravtrykk - harde data om forfatterens stilistiske underverker.

Deretter kjørte han de samme testene på fire andre bøker: The Casual Vacancy, Rowlings første post-Harry Potter-roman, pluss tre stilistisk lignende kriminalromaner av andre kvinnelige forfattere. Juola konkluderte med at Rowling var den mest sannsynlige forfatteren av The Cuckoo's Calling, siden hun var den eneste hvis skrivestil dukket opp som den nærmeste eller nest nærmeste kampen i hver av testene. Etter å ha konsultert en Oxford-språkforsker og mottatt en enstemmig mening, konfronterte avisen Rowling, som tilsto.

Juola fullførte analysen på omtrent en halv time. Derimot hadde det tidlig på 1960-tallet tatt et team med to statistikere - som brukte det som den gang var en topp moderne datamaskin på MIT - tre år å fullføre et prosjekt for å avsløre hvem som skrev 12 usignerte Federalist Papers.

Robert Leonard, som leder det rettsmedisinske språkvitenskapsprogrammet ved Hofstra University, har også gjort en karriere ut fra å bestemme forfatterskap. Han er sertifisert for å tjene som et sakkyndig vitne i 13 stater, og har fremlagt bevis i saker som Christopher Coleman, som ble arrestert i 2009 for drap på familien i Waterloo, Illinois. Leonard vitnet om at Colemans skrivemåte stemte overens med trusler som ble spraylakkert hjemme hos familien (foto, til venstre). Coleman ble dømt og soner livstid.

Siden rettsmedisinske lingvister tar for seg sannsynligheter, ikke sikkerhet, er det desto mer viktig å videreutvikle dette fagfeltet, sier eksperter. "Det har vært tilfeller der det var mitt inntrykk at bevisene som folk ble frigjort eller dømt for var ustabile på en eller annen måte, " sier Edward Finegan, president i International Association of Forensic Linguists. Vanderbilt jusprofessor Edward Cheng, en ekspert på påliteligheten av rettsmedisinske bevis, sier at språklig analyse er best brukt når bare en håndfull mennesker kunne ha skrevet en gitt tekst.

I takt med at rettsmedisinsk språkvitenskap fortsetter å overskride, kan kriminelle innse viktigheten av å velge ordene sine nøye. Og noen bekymrer seg for at programvare også kan brukes til å skjule særegne skriftlige stiler. "Alt du kan identifisere for å analysere, " sier Juola, "jeg kan identifisere og prøve å skjule."

Hvordan avdekket datamaskiner JK Rowlings pseudonym?