https://frosthead.com

Hvordan et dataprogram kan lære alt om deg bare fra Facebook-likes

Oddsen er at når du bestemte deg for å "like" et TV-show, et band, en lokal virksomhet eller et produkt på Facebook-siden, så forestilte du deg ikke at det klikket ville ha stor konsekvens. Det kan vise vennene dine litt om interessene dine, og føre til at statusoppdateringer fra siden vises i nyhetsfeeden din.

"Likes" er imidlertid offentlig tilgjengelig for alle å se på Facebook, selv folk du ikke har godkjent som venner. Og for en ny studie publisert i dag i Proceedings of the National Academy of Sciences, opprettet en gruppe forskere et dataprogram som kan ta en brukers “likes” og nøyaktig utlede et enormt spekter av informasjon om ham eller henne - inkludert alder, etnisitet, IQ, politiske tilbøyeligheter, stoffbruk og til og med seksuell legning.

For studien analyserte forskergruppen - et partnerskap mellom Psychometrics Lab ved University of Cambridge og Microsoft Research Cambridge - dataene fra 58 000 amerikanske Facebook-brukere som hadde valgt å levere sine profiler og “likes” for analyse gjennom Facebooks myPersonality-app. Forskerne matet disse “likes” inn i en algoritme, bygget spesielt for dette prosjektet, og sammenlignet deretter modellens forutsigelser om en rekke egenskaper med det de visste med sikkerhet om brukerne, som hadde sendt inn innholdet i Facebook-profilene sine for analyse også.

For hvert par egenskaper som ble undersøkt - for eksempel kaukasisk eller afroamerikansk, eller demokrat eller republikaner - valgte forskerne et par brukere, med ett tilhørende hver kategori, og algoritmen måtte blindt velge hvilken bruker som passer til hvilken kategori bare basert på deres "liker." Det var ikke 100 prosent perfekt til å utlede noen av kategoriene, men det var uanstendig nøyaktig når det gjaldt å forutsi mange, inkludert noen kjennetegn du antagelig ikke vil anta at du kan gjette fra "likes".

Det konkluderte med rette hvilken bruker som var kaukasiske og afroamerikanske 95 prosent av tiden, demokrat og republikaner 88 prosent av tiden og kristen og muslim 82 prosent av tiden. En oversikt over dens nøyaktighet når det gjelder å forutsi mange av de karakteriserte egenskapene (som en påminnelse, en verdi på 1 ville indikere at modellen er 100 prosent nøyaktig) er nedenfor.

Modellen spådde en rekke brukeregenskaper med uhyggelig nøyaktighet. Modellen spådde en rekke brukeregenskaper med uhyggelig nøyaktighet. (Bilde via PNAS / Kosinski et al.)

For de fleste av brukerne var dette nøyaktighetsnivået ikke avhengig av noen åpenbare "likes" som man kan knytte til den egenskapen som ble vurdert. For eksempel hadde mindre enn 5 prosent av brukerne som ble identifisert som homofile “likt” homofilt ekteskap, eller andre relaterte sider.

Algoritmen samlet i stedet mange tonn tilsynelatende ikke-relaterte “likes” for å gruppere brukere i klasser som delte forutsigbare likheter. Ved å sammenligne "likes" med resultatene fra en personlighetstest (også en del av myPersonality-appen), fant forskerne at brukere som "liker" "Tordenvær", "The Colbert Report", "Science" eller "Curly Fries" alle er litt mer sannsynlig å ha høy IQ enn de som ikke gjør det. Tilsvarende var mannlige brukere som "likte" "Mac Cosmetics" eller "Wicked The Musical" litt mer sannsynlig å være homofile, mens de som likte "Wu-Tang Clan" eller "Shaq" var litt mindre sannsynlige.

Å analysere alle brukerens “likes” gjorde det mulig for algoritmen å lage et samlet portrett av dem, men nøyaktigheten ble sterkt påvirket av antall “likes” for hver bruker. For dem i den lave enden, med 1-10 likes, var spådommene ikke bedre enn sjansen, men for de med 150 til 300 "likes", var algoritmen i stand til å forbedre sin evne til å gjette brukerens egenskaper i enda bedre grad .

Forskerne gjennomførte først og fremst studien for å vise hvor mye vår offentlig tilgjengelige informasjon kan fortelle om oss. Det er ikke sikkert du legger ut din seksuelle legning, politiske synspunkter eller om du bruker narkotika offentlig, men denne typen programmer kan analysere "likes" og komme med ganske nøyaktige gjetninger uansett.

Selv om brukerne hadde sendt inn sine "likes" og profiler for analyse via en tredjeparts-app, betyr Facebook standard personverninnstillinger at "likes" dine er offentlige for noen. Allerede bruker Facebooks egne algoritmer disse liker for å diktere hvilke historier som havner i brukernes nyhetsstrømmer, og annonsører kan få tilgang til dem for å finne ut hvilke som er de mest effektive annonsene å vise deg når du surfer.

Hvordan et dataprogram kan lære alt om deg bare fra Facebook-likes