https://frosthead.com

Tweetsene dine kan spå når du får influensa

I 1854, som svar på en ødeleggende koleraepidemi som feide gjennom London, introduserte den britiske legen John Snow en idé som skulle revolusjonere folkehelsefeltet: det epidemiologiske kartet. Ved å registrere tilfeller av kolera i forskjellige bydeler i byen og plotte dem på et kart basert på pasientenes boliger, oppdaget han at en enkelt forurenset vannpumpe var ansvarlig for en stor del av infeksjonene.

Kartet overtalte ham - og til slutt, de offentlige myndighetene - at miasma-teorien om sykdom (som hevdet at sykdommer spredte seg via skadelige gasser) var falsk, og at kimteorien (som med rette hevdet at mikroorganismer hadde skylden) var sann. De satte en lås på håndtaket på pumpen som var ansvarlig for utbruddet, og signaliserte et paradigmeskifte som permanent endret hvordan vi håndterer smittsomme sykdommer og dermed sanitære forhold.

Kartleggingsteknologien er ganske annerledes, som sykdommen er, men det er en viss likhet mellom Snows kart og et nytt prosjekt utført av en gruppe forskere ledet av Henry Kautz ved University of Rochester. Ved å lage algoritmer som kan oppdage influensatrender og lage forutsigelser basert på nøkkelord i offentlig tilgjengelige geotaggede tweets, tar de en ny tilnærming til å studere overføring av sykdom - en som kan endre måten vi studerer og sporer bevegelsen av sykdommer i samfunnet .

"Vi kan tenke på mennesker som sensorer som ser på verden rundt dem og deretter rapportere hva de ser og opplever på sosiale medier, " forklarer Kautz. "Dette lar oss gjøre detaljerte målinger i en populasjonsskala, og krever ikke aktiv brukermedvirkning."

Med andre ord, når vi twitrer at vi nettopp har blitt lagt ned av en smertefull hoste og feber, gir vi ubevisst rik data for et enormt folkehelseeksperiment, informasjon som forskere kan bruke til å spore bevegelse av sykdommer som influensa i høy oppløsning og sanntid.

Kautz 'prosjekt, kalt SocialHealth, har brukt tweets og andre slags sosiale medier for å spore en rekke folkehelsespørsmål - nylig begynte de å bruke tweets for å overvåke forekomster av matforgiftning på restauranter i New York City ved å logge alle som hadde lagt ut geotaggede tweets fra en restaurant, og fulgte deretter tweets de neste 72 timene, og sjekk for omtaler av oppkast, diaré, magesmerter, feber eller frysninger. Da de oppdaget 480 sannsynlige tilfeller av matforgiftning.

Men når sesongen endres, er det deres arbeid å spore influensavirus som er mest øyeåpende. Google Flu Trends har på samme måte forsøkt å bruke Google-søkere for å spore bevegelsen av influensa, men modellen overvurderte fjorårets utbrudd, kanskje fordi mediedekningen av influensa fikk folk til å begynne å lage influensarelaterte spørsmål. Twitter-analyse representerer et nytt datasett med noen få kvaliteter - en høyere geografisk oppløsning og muligheten til å fange bevegelsen til en bruker over tid - som kan gi bedre spådommer.

For å starte deres influensasporingsprosjekt, så SocialHealth-forskerne spesielt på New York og samlet rundt 16 millioner geotaggede offentlige tweets per måned fra 600 000 brukere i tre måneder. Nedenfor er en tidsperiode av en Twitter-dag i New York, med forskjellige farger som representerer forskjellige frekvenser av tweets på det stedet (blått og grønt betyr færre tweets, oransje og rødt betyr mer):

For å benytte seg av alle disse dataene utviklet teamet hans en algoritme som bestemmer om hver tweet representerer en rapport om influensalignende symptomer. Tidligere hadde andre forskere ganske enkelt gjort dette ved å søke etter nøkkelord i tweets ("syke", for eksempel), men teamet hans fant ut at tilnærmingen fører til falske positiver: Mange flere brukere twitret at de er lei av lekser enn de er føler meg dårlig.

For å redegjøre for dette ser teamets algoritme etter tre ord på rad (i stedet for ett), og vurderer hvor ofte den bestemte sekvensen er en indikasjon på en sykdom, basert på et sett tweets de manuelt hadde merket. Uttrykket "syk av influensa" er for eksempel sterkt korrelert med sykdom, mens "syk og lei" er mindre. Noen spesielle ord - hodepine, feber, hoste - er sterkt knyttet til sykdom uansett hvilken tre-ordssekvens de er en del av.

Når disse millionene tweets var kodet, kunne forskerne gjøre noen få spennende ting med dem. For det første så de på endringer i influensarelaterte tweets over tid, og sammenlignet dem med nivåer av influensa som rapportert av CDC, og bekreftet at tweets nøyaktig fanget den generelle trenden i influensa. I motsetning til CDC-data, er de imidlertid tilgjengelige i nesten sanntid, snarere enn en uke eller to etter faktum.

Men de gikk også dypere, og så på samspillet mellom forskjellige brukere - som representert av to brukere som twitret fra samme sted (GPS-oppløsningen er omtrent en halv byblokk) i løpet av samme time - for å modellere hvor sannsynlig det er at en sunn person ville bli syk etter å ha kommet i kontakt med noen med influensa. Det er klart at to personer som twitret fra den samme blokken med 40 minutters mellomrom ikke nødvendigvis møtte personlig, men oddsen for at de har møttes er litt høyere enn to tilfeldige brukere.

Som et resultat, når du ser på et stort nok datasett av interaksjoner, dukker det opp et bilde av overføring. De fant ut at hvis en sunn bruker møter 40 andre brukere som rapporterer seg som syke med influensasymptomer, øker sjansen for å få influensasymptomer dagen etter fra mindre enn én prosent til 20 prosent. Med 60 interaksjoner stiger tallet til 50 prosent.

Teamet så også på interaksjoner på Twitter selv, og isolerte par brukere som følger hverandre og kaller dem “vennskap.” Selv om mange Twitter-forhold bare eksisterer på nettet, tilsvarer noen interaksjoner i det virkelige liv, og de fant ut at en bruker som har ti venner som rapporterer seg som syke, er 28 prosent mer sannsynlig å bli syke dagen etter. Totalt, ved å bruke begge disse typer interaksjoner, klarte algoritmen deres å forutsi om en sunn person ville bli syk (og tweet om det) med 90 prosent nøyaktighet.

Vi er fremdeles i de tidlige stadiene av denne forskningen, og det er mange begrensninger: De fleste bruker fortsatt ikke Twitter (ja, egentlig), og selv om de gjør det, kan de ikke tweete om å bli syke.

Men hvis denne typen system kan utvikles videre, er det lett å forestille seg alle slags applikasjoner. Smarttelefonen din kan automatisk advare deg, for eksempel hvis du hadde brukt for mye tid på stedene okkupert av mennesker med influensa og bedt deg om å reise hjem for å slutte å sette deg i smitteveien. En hel bys innbyggere kunne til og med bli advart om det var på grensen til et utbrudd.

Til tross for de 150 årene vi er fjernet fra gjennombruddet til kartleggingen av John Snow, er det klart at det fortsatt er aspekter ved sykdomsinformasjon vi ikke helt forstår. Nå som da kan kartlegging av dataene bidra til å gi svarene.

Tweetsene dine kan spå når du får influensa