https://frosthead.com

Det store flertallet av rå data fra gamle vitenskapelige studier kan nå mangle

Et av grunnlagene for den vitenskapelige metoden er reproduserbarhet av resultater. I et laboratorium hvor som helst i verden, skal en forsker kunne studere det samme emnet som en annen forsker og reprodusere de samme dataene, eller analysere de samme dataene og legge merke til de samme mønstrene.

Dette er grunnen til at funnene fra en studie publisert i dag i Current Biology er så bekymringsfulle. Da en gruppe forskere prøvde å sende e-post til forfatterne av 516 biologiske studier publisert mellom 1991 og 2011 og be om rå data, ble de forferdet over å finne at mer 90 prosent av de eldste dataene (fra artikler skrevet for mer enn 20 år siden) var utilgjengelig. Til sammen, selv inkludert papirer som ble publisert så sent som i 2011, klarte de bare å spore opp dataene for 23 prosent.

"Alle slags vet at hvis du ber en forsker om data fra gamle studier, vil de ha og ha, fordi de ikke vet hvor det er, " sier Timothy Vines, zoolog ved University of British Columbia, som ledet innsatsen. "Men det hadde egentlig aldri vært systematiske estimater for hvor raskt dataene som forfatterne har, forsvinner."

For å gjøre sitt estimat valgte gruppen hans en type data som har vært relativt konsistente over tid - anatomiske målinger av planter og dyr - og gravd opp mellom 25 og 40 papirer for hvert odde år i perioden som brukte denne typen data, for å se hvis de kunne jakte de rå tallene.

En overraskende mengde av henvendelsene deres ble stoppet på aller første trinn: For 25 prosent av studiene fant man ikke aktive e-postadresser, med ikke-adresserte adresser oppført på selve papiret og websøk som ikke viste noen aktuelle adresser. For ytterligere 38 prosent av studiene førte spørsmålene til dem uten svar. Ytterligere 7 prosent av datasettene gikk tapt eller utilgjengelige.

Noe av tiden ble det for eksempel lagret på en halvannen tomanns diskett, så ingen fikk tilgang til den, fordi de ikke lenger hadde de riktige stasjonene, "sier Vines. Fordi den grunnleggende ideen om å oppbevare data er slik at de kan brukes av andre i fremtidig forskning, gjør denne typen foreldelse dataene ubrukelig.

Dette kan virke som verdslige hindringer, men forskere er akkurat som resten av oss - de skifter e-postadresser, de får nye datamaskiner med forskjellige stasjoner, de mister sine sikkerhetskopier av filer - så disse trendene gjenspeiler alvorlige, systemiske problemer i vitenskapen.

Og å bevare data er så viktig, det er verdt å huske, fordi det er umulig å forutsi i hvilke retninger forskning vil bevege seg i fremtiden. Vines har for eksempel forsket på et par paddearter hjemmehørende i Øst-Europa som ser ut til å være i ferd med å hybridisere. På 1980-tallet arbeidet han med et eget team av forskere med det samme emnet, og kom over en gammel artikkel som dokumenterte fordelingen av disse paddene på 1930-tallet. Når de visste at distribusjonen deres hadde endret seg relativt lite i løpet av de tiår mellom år, ga forskerne mulighet til å gjøre alle slags beregninger som ikke ville vært mulig ellers. "At de originale dataene var tilgjengelige, fra en veldig liten gammel studie skrevet på polsk, var utrolig nyttige for forskere som kom med 70 år senere, " sier han.

Det er også det faktum at så mye av denne forskningen blir betalt med offentlig finansiering, mye av den kommer gjennom tilskudd som bestemmer at resulterende data blir fritt tilgjengelig for allmennheten. I tillegg påvirkes feltdata av omstendighetene i miljøet de samles inn i - det er derfor umulig å gjenskape perfekt senere, når forholdene har endret seg.

Hva er løsningen? Noen tidsskrifter - inkludert Molecular Ecology, hvorav Vines er en administrerende redaktør - har vedtatt retningslinjer som krever at forfattere sender inn rå data sammen med papirene sine, slik at tidsskriftet selv kan arkivere dataene i evighet. Selv om tidsskrifter, som mennesker, er mottakelige for å endre e-postadresser og teknologisk foreldelse, kan disse problemene håndteres mye lettere på institusjonell skala.

Det store flertallet av rå data fra gamle vitenskapelige studier kan nå mangle