Indus-sivilisasjonen, som blomstret gjennom store deler av det tredje årtusen f.Kr., var det tids mest omfattende samfunn. På høyden omfattet det et område på mer enn en halv million kvadrat miles sentrert på det som i dag er India-Pakistan grensen. Rester av Indus er funnet så langt nord som Himalaya og så langt sør som Mumbai. Det var den tidligste kjente urbane kulturen i subkontinentet, og den skilte med to store byer, en ved Harappa og en ved Mohenjo-daro. Til tross for sin størrelse og levetid, og til tross for nesten et århundre med arkeologiske undersøkelser, forblir mye om Indus hylt av mystikk.
Det lille vi vet har kommet fra arkeologiske graver som begynte på 1920-tallet og fortsetter i dag. I løpet av flere tiår har arkeologer funnet mange gjenstander, inkludert frimerketetninger, amuletter og små tabletter. Mange av disse gjenstandene bærer det som ser ut til å være eksempler på å skrive - inngraverte figurer som ligner blant annet vingede hestesko, spoke hjul og oppreist fisk. Hva nøyaktig disse symbolene kan bety, forblir imidlertid en av de mest berømte uløste gåtene i stipendet fra gamle sivilisasjoner.
Det har vært andre tøffe koder å knekke i historien. Stumpede egyptologer fikk en heldig pause med oppdagelsen av den berømte Rosetta steinen i 1799, som inneholdt tekst på både egyptisk og gresk. Studien av maya-hieroglyfer langsomt til en russisk språkforsker ved navn Yury Knorozov gjorde smart bruk av samtidige talte mayaer på 1950-tallet. Men det er ingen Rosetta-stein fra Indus, og lærde vet ikke hvilke, om noen, språk kan ha kommet ned fra det som ble talt av indusfolket.
For rundt 22 år siden, i Hyderabad, India, snudde en åttendeklassing ved navn Rajesh Rao siden til en historiebok og lærte først om denne fascinerende sivilisasjonen og dens mystiske manus. I årene som fulgte tok Raos skolegang og yrke ham i en annen retning - han avviklet videreutviklet informatikk, som han lærer i dag ved University of Washington i Seattle - men han overvåket Indus-stipend nøye og holdt oversikt over dusinvis av mislykkede forsøk på å gi mening om manuset. Selv mens han studerte kunstig intelligens og robotikk, samlet Rao et lite bibliotek med bøker og monografier på Indus-manuset, omtrent 30 av dem. På en bokhylle i nærheten oppbevarte han også den elskede historieboka på åttende klasse som introduserte ham for Indus.
"Det var bare fantastisk å se antall forskjellige ideer folk foreslo, " sier han. Noen forskere hevdet at forfatterskapet var en slags sumerisk manus; andre ligger i Dravidian-familien; fortsatt andre trodde det var relatert til et språk på Påskeøya. Rao innså at dette var "sannsynligvis et av de mest utfordrende problemene i forhold til eldgamle historie."
Ettersom forsøk etter forsøk ikke mislyktes med å dechiffrere manuset, begynte noen eksperter å miste håpet om at det kunne dekodes. I 2004 hevdet tre lærde i en kontroversiell artikkel at Indus-symbolene ikke hadde språklig innhold i det hele tatt. I stedet kan symbolene ha vært lite mer enn piktogrammer som representerer politiske eller religiøse skikkelser. Forfatterne gikk så langt som å antyde at Indus overhode ikke var en litterert sivilisasjon. For noen i felt begynte hele jakten på å prøve å finne språk bak Indus-etsningene å ligne en øvelse i nytteløshet.
Noen år senere gikk Rao inn i striden. Inntil da var folk som studerte manuset arkeologer, historikere, språkvitere eller kryptologer. Men Rao bestemte seg for å lokke ut hemmelighetene til Indus-manuset ved å bruke det verktøyet han kjente best - datavitenskap.
Rajesh Rao er fascinert av indus-sivilisasjonen siden åttende klasse, og bruker datavitenskap og et konsept kalt "betinget entropi" for å avkode Indus-manuset. (Med tillatelse av David Zax) I løpet av flere tiår har arkeologer funnet mange gjenstander fra indus-sivilisasjonen, inkludert frimerketetninger, amuletter og små tabletter. (Robert Harding / Robert Harding World Imagery / Corbis) Rao og hans samarbeidspartnere publiserte funnene sine i tidsskriftet Science i mai. De dechiffrerte ikke språket, men funnene deres skjerpet forståelsen av det. (Robert Harding / Robert Harding World Imagery / Corbis) Rao og kollegene ser nå på lengre karakterstrenger enn de analyserte i Science- artikkelen. Å finne mønstre vil igjen bidra til å bestemme hvilke språkfamilier skriptet kan tilhøre. (Med tillatelse av David Zax)En sommerdag i Seattle ønsket Rao meg velkommen inn på kontoret sitt for å vise meg hvordan han og kollegene taklet problemet. Han satte frem en samling kopier av inntrykk av leiretetninger som arkeologer har dukket opp fra Indus-steder. De er små - som små firkantede sjokolader - og de fleste av dem har et bilde av et dyr under en serie Indus-symboler. De fleste eksempler av Indus-skriptet er miniatyrer som disse, og har bare noen få tegn; ingen grandmonolitter er blitt oppdaget. Forskere er usikre på funksjonen til de små selene, sa Rao til meg, men en teori er at de kan ha blitt brukt til å sertifisere kvaliteten på omsatte varer. En annen antyder at selene kan ha vært en måte å sikre at handelsmenn betalte skatt ved innreise eller forlat en by - det er funnet mange seler i ruinene av porthusene, som kan ha fungert som gamle bompenger.
Rao og kollegene prøvde ikke å utføre mirakler - de visste at de ikke hadde nok informasjon til å tyde det gamle skriften - men de antok at ved å bruke beregningsmetoder, kunne de i det minste begynne å finne ut hva slags skrift Indus hadde skriptet var: kodet det språk, eller ikke? De gjorde dette ved å bruke et konsept kalt "betinget entropi."
Til tross for det imponerende navnet, er betinget entropi et ganske enkelt begrep: det er et mål på mengden tilfeldighet i en sekvens. Tenk på alfabetet vårt. Hvis du skulle ta Scrabble fliser og kaste dem i luften, kan du finne et gammelt brev dukker opp etter noe annet. Men i virkelige engelske ord er det mer sannsynlig at visse bokstaver forekommer etter andre. En q på engelsk følges nesten alltid av en u . A t kan følges av en r eller e, men er mindre sannsynlig å bli fulgt av en n eller a b .
Rao og hans samarbeidspartnere - en internasjonal gruppe som inkluderer informatikere, astrofysikere og en matematiker - brukte et dataprogram for å måle betinget entropi av Indus-manuset. Deretter målte de betinget entropi av andre typer systemer - naturlige språk (sumerisk, tamil, sanskrit og engelsk), et kunstig språk (dataprogrammeringsspråket Fortran) og ikke-språklige systemer (humane DNA-sekvenser, bakterielle proteinsekvenser og to kunstige datasett som representerer høye og lave ytterpunkter av betinget entropi). Da de sammenlignet mengden tilfeldighet i Indus-manuset med den fra de andre systemene, fant de ut at den lignet mest på hastighetene som ble funnet på de naturlige språkene. De publiserte funnene sine i mai i tidsskriftet Science .
Hvis det ser ut som et språk, og det fungerer som et språk, er det sannsynligvis et språk, antyder papiret deres. Funnene dechiffrerer selvfølgelig ikke skriptet, men de skjerper forståelsen vår for det, og har gitt trygghet til de arkeologene som hadde jobbet under antagelsen at Indus-skriptet koder for språk.
Etter å ha publisert papiret, fikk Rao en overraskelse. Spørsmålet om hvilken språkfamilie manuset tilhører, viser det seg, er et følsomt: på grunn av Indus-sivilisasjonens alder og betydning, ønsker mange samtidsgrupper i India å hevde det som en direkte stamfar. For eksempel foretrekker de tamilspråklige indianere i sør å lære at Indus-manuset var en slags proto-dravidisk, siden tamil er stammet fra proto-dravidisk. Hindi-høyttalere i nord vil heller at det er en gammel form for sanskrit, en stamfar til hindi. Raos papir konkluderer ikke med hvilken språkfamilie manuset tilhører, selv om det bemerker at den betingede entropien ligner på gammelt tamil - noe som får noen kritikere til å "anklage oss for å være dravidiske nasjonalister, " sier Rao. "Gjerningen til anklagene og angrepene var helt uventet."
Rao tar noen ganger lettelse når han kommer tilbake til den mindre voldsomt omstridte verden av nevrovitenskap og robotikk. Men samtalen til Indus-skriften forblir forlokkende, og "det som tidligere var en hobby, monopoliserer nå mer enn en tredjedel av tiden min, " sier han. Rao og kollegene ser nå på lengre karakterstrenger enn de analyserte i Science- artikkelen. "Hvis det er mønstre, " sier Rao, "kan vi komme med grammatiske regler. Det vil igjen gi begrensninger for hva slags språkfamilier ”manuset kan tilhøre.
Han håper at hans fremtidige funn vil tale for seg selv, og medfører mindre lønn fra motstandere som har rot for en region i India kontra en annen. Når Rao for sin del snakker om hva Indus-manuset betyr for ham, pleier han å snakke i form av India som en helhet. "Indias arv ville være betydelig beriket hvis vi var i stand til å forstå Indus-sivilisasjonen, " sier han. Rao og hans samarbeidspartnere jobber med det, en linje med kildekode om gangen.