Vi er inne i Big Data-epoken, hvor noen forskere graver gjennom absolutt svimlende mengder informasjon for å låse opp verdens hemmeligheter. Ta for eksempel beregningsbiologen Yaniv Erlich. Ved å bruke data fra et nettsted for geneaologi, sier Nature, har Erlich og kollegene bygget enorme slektstrær. Ett tre de sier, forbinder prikkene mellom 13 millioner forskjellige mennesker, en arv som strekker seg mer enn 500 år tilbake.
Totalt, sier Erlich på sin hjemmeside, har det genetiske treprosjektet, kalt FamiLinx, samlet informasjonen til 43 millioner mennesker. Etter forbindelsene mellom mennesker, kunne Erlich og Geni.com følge en del av historien til letealderen.
Utgangspunktet for FamiLinx var den offentlige informasjonen på Geni.com, et slektsstyringsdrevet sosialt nettverk som drives av MyHeritage. Geni.com lar slektsforskere oppgi slektstrærne sine på nettstedet og lage profiler av familiemedlemmer med grunnleggende demografisk informasjon som kjønn, fødselsdato, sivilstand og beliggenhet. Slektsforskerne bestemmer om de vil at profilene i trærne skal være offentlige eller private. Nye eller modifiserte slektstreprofiler sammenlignes konstant med alle eksisterende profiler, og hvis det er stor likhet med eksisterende, tilbyr nettstedet brukerne muligheten til å slå sammen profilene og koble trærne.
Ved å skrape dataene, sier Nature, åpner Erlich døren for, potensielt, fremtiden til humangenetisk forskning.
Strukturen til trærne i seg selv kan gi interessant informasjon om menneskelig demografi og utvidelse av befolkningen, sier Nancy Cox, en humangenetiker ved University of Chicago, Illinois, som ikke var involvert i studien. Men mer interessant, sier hun, er muligheten for at slike data en dag kan knyttes til medisinsk informasjon eller til DNA-sekvensdata ettersom flere mennesker har genomene deres sekvensert og deponerer den informasjonen i offentlige databaser.
Mer fra Smithsonian.com:
Det nyeste medlemmet av det menneskelige slektstreet