https://frosthead.com

Ser du etter nye funn i gamle data

Hva skjer med gamle laboratorie-notatbøker og andre poster med vitenskapelige data? Det er fremdeles nyttig, men ikke så mye når det støpes bort i en boks i bunnen av et skap. Men nå starter en gruppe forskere som nylig møttes på konferansen Committee for Data for Science and Technology (CODATA) en global innsats for å hente disse dataene, rapporterte Nature forrige uke. Gruppen vil be forskere, museer og universiteter om hva de kan ha gjemt og publisere en oversikt over hva de finner i 2012. Naturrapporter :

Det er ikke bare data i gamle bøker eller fotografier som er i faresonen. Digital informasjon samlet inn mellom 1950 og 1980 er også truet, fordi den er lagret på utdaterte medier ofte utsatt for forringelse, for eksempel magnetbånd og disketter, noe som gjør det stadig vanskeligere å få tilgang til og hente. Utviklingsland er vertskap for noen av de mest verdifulle dataene - fra landbruk til sykdomsstatistikk - og de mest truede, for eksempel av lokal konflikt og mangelfull eller ujevn lagring.

Gamle plater har mer enn bevist at de er verdt nå. Data fra skipes loggbøker, for eksempel, er blitt brukt til å studere historien om hvalfangst, klimaendringer og planetens magnetiske felt. Zooniverse --- som tidligere har benyttet seg av kjedelige menneskers kraft til å søke gjennom bilder av himmelen etter supernovaer og kosmiske sammenslåinger --- har sluppet løs horden av innbyggerforskere på rekordbøker fra Royal Navy-skip fra første verdenskrig å samle inn data og forbedre en database med værekstremer.

Bruk litt tid på det Zooniverse-nettstedet, og du vil raskt innse hvilket enormt prosjekt det vil være å hente data fra alle kilder som er gravd opp av CODATA-gruppen. Fordi det ikke er nok å bare vite hva som finnes der --- for at dataene skal være til nytte og bevares for fremtiden, vil de også måtte digitaliseres. Og å håndtere alle disse dataene vil være enda et problem. Men å ha for mye data er et problem tror jeg de fleste forskere ikke hadde noe imot å ha.

Ser du etter nye funn i gamle data