Big data blir så stor, det sklir de jordiske båndene.
En oppstart som heter Orbital Insight, som nylig samlet inn nesten 9 millioner dollar i finansiering, bruker satellittbilder og nyskapende datateknikker for å estimere globalt oljeoverskudd, forutsi avlingstap før høstingstid og oppdage detaljhandelstrender ved å holde oversikt over antall biler i storboks-parkeringsplasser. Det skal også være mulig å trene programvaren for å oppdage ulovlig avskoging tidlig og bedre spore klimaendringer.
Selskapet bruker maskinlæringsteknikker og datanettverk som etterligner menneskets hjerne for å oppdage mønstre i enorme mengder visuelle data. Facebook bruker lignende teknikker for å gjenkjenne ansikter i opplastede bilder og automatisk merke deg og vennene dine. Men i stedet for å søke etter ansikter, drar Orbital Insight fordel av den økende overflaten av satellittbilder, takket være fremveksten av små, billige satellitter, og lærer nettverkene sine å automatisk gjenkjenne ting som kjøretøy, byggekraften i Kina og skyggene støpt av oljebeholdere med flytende lokk, som endres avhengig av hvor fulle de er.
Det ville selvfølgelig være umulig for mennesker å sile gjennom regelmessig oppdaterte globale satellittbilder. Men med massivt parallelle datamaskiner og avanserte teknikkgjenkjenningsteknikker, sikter Orbital Insight å levere typer data som ikke har vært tilgjengelig før. Nåværende globale estimater for olje er for eksempel allerede seks uker gamle når de publiseres. Med Orbital kan analyse av avlingene leveres midt i sesongen - viktig informasjon å ha, enten du er en FN-arbeider på høyt nivå som prøver å komme foran en matkrise, eller en handelsvare som jobber for et hedgefond.
Orbital Insight har ikke eksistert lenge - det ble grunnlagt i slutten av 2013 og kom først ut av "stealth mode" sent i fjor. Men selskapets grunnlegger, James Crawford, har god erfaring innen kompatible felt. Han var tidligere autonomi- og robotikkleder ved NASAs Ames Research Center, og tilbrakte også to år som ingeniørdirektør hos Google Books, og gjorde arkiverte trykte sider til søkbar tekst.
Flere selskaper, som Spire og Inmarsat, og til og med Teslas Elon Musk, jobber med maskinvare - designe og lansere nye nettverk av satellitter - men Crawford sier Orbital Insight i stedet fokuserer rent på programvare.
"På noen måter ser jeg hva vi gjør her i drivkraften til dette selskapet, " sier Crawford, "tar mye av læringen [på Google] om hvordan du gjør big data, hvordan du bruker [kunstig intelligens], hvordan du bruker maskinlæring på disse rørledningene til bilder, og bruker det på satellittområdet. ”
Crawfords selskap kan være et av få som jobber med å bruke nye programvareteknikker som kunstige nevrale nettverk og maskinlæring for å analysere satellitt bilder. Men teknikken han bruker, også kjent som dyp læring, eksploderer i teknologirommet for øyeblikket. Etablerte selskaper som Facebook, Google og Microsoft bruker dyp læringsteknikker for ting som automatisk bildemerking og forbedret talegjenkjenning og oversettelse. IBM kjøpte også nylig et dypt læringsselskap, kalt AlchemyAPI, for å forbedre Watson-datasystemet.
Med dyp læring, etterligner kraftige datamaskiner og flere lag med samtidig kjennemønstergjenkjenning (derav den "dype" i dyp læring) de nevrale nettverkene til den menneskelige hjernen. Målet er å få en datamaskin til å "lære" å gjenkjenne mønstre eller utføre oppgaver som vil være for kompliserte og tidkrevende å "lære" ved bruk av tradisjonell programvare.
Detaljene om dyp læring er tekniske, men på helt grunnleggende nivå er det overraskende enkelt. Når det gjelder å måle detaljhandelstrender med parkeringsaktivitet, sier Crawford at selskapet først har ansatte manuelt å merke biler på noen hundre parkeringsplasser med røde prikker. "Så fører du hver enkelt bil inn i det nevrale nettverket, og det generaliserer mønstrene lys og mørke, mønsteret med piksler på en bil, " sier Crawford. "Og når [datamaskinen] ser på et nytt bilde, er det det egentlig gjør ganske sofistikert, men fremdeles et mønstermatch."
Når han estimerer detaljhandelsaktivitet, sier Crawford at selskapet hans er mye bedre til å utlede hvordan det er med en kjede på nasjonalt nivå, ved å måle hvor fulle parkeringsplasser er over tid og sammenligne det med hvor fulle de samme partiene var i tidligere kvartaler ved å bruke eldre bilder, enn å måle helsen til en individuell butikk.
Han innrømmer at mange forhandlere allerede har måter å spore disse dataene for sine egne butikker, men de ville gjerne vite hvordan det går med konkurrentene måneder før økonomiske resultater blir gitt ut. Det samme vil være tilfelle for hedgefond, som Crawford sier er noen av selskapets tidligste kunder. Det er lett å se hvordan denne typen data kan gi investorene et ben. Satellittbilder er allerede tilgjengelig, og Orbital Insight bare analyserer det, så det er usannsynlig at det vil vekke noen problemer med innsidehandel.
Hvis nettverket gjør en og annen feil, for eksempel å forvirre en dumpster for en bil, er det ikke mye av et problem, forklarer Crawford, fordi feilene har en tendens til å avbryte hverandre i stor skala. For ting som oljeestimater, selv om de er borte med flere prosentpoeng, er det fortsatt bedre enn å vente i opptil seks uker på mer konkrete data.
Selv om oppstarten virker fokusert på å levere data til markedsinvestorer først, kan det selskapet gjør også brukes til mer altruistisk bruk. "Vi er nysgjerrige i fremtiden om å bruke dette til å oppdage avskoging og å oppdage ting som veibygging som kan være en forløper for avskoging, " sier Crawford. "Det er også veldig interessante ting som kan gjøres rundt å se på snøpakke, vann og andre aspekter for klimaendringer." Han sier også at de ser på jordbruket i den tredje verden, og sier at multispektrale bilder er en god måte å fortelle om hvor sunne planter er, for å forutsi avlingsfeil.
Selvfølgelig, ethvert aspekt av big data som også inkluderer satellittbilder, fører til personvernproblemer. Men Orbital Insight tar ikke bildene, de får tilgang til og analyserer bilder som allerede er tilgjengelige. Og som Crawford påpeker, bestemmer gjeldende amerikanske forskrifter for kommersielle bildesatellitter at du ikke kan gå under 20 cm per piksel. Ved den oppløsningen ville gjennomsnittlig person dukke opp som noen få prikker. Så det ville være tøft å skille enkeltpersoner i det hele tatt, enn si en persons identitet eller til og med kjønn.
Crawford sier at mye av de kortsiktige fremskrittene innen dyp læringsteknikker generelt vil innebære å forenkle og automatisere tweaks til algoritmene (noe som betyr mindre manuelt tagging av biler eller kornfelt), slik at selskaper raskere kan bruke maskinlæring på nye områder.
Når det gjelder Orbital Insights fremtid, snakker ikke selskapets grunnlegger definitivt lite. Han sammenligner hva selskapet gjør med å lage et "makroskop" som kan påvirke verden i lignende grad som mikroskopet forvandlet biologi.
"Mye av det vi ser om jorden, enten det er kornutbytte eller avskoging, eller oljebeholdning, er så store at du ikke kan se dem med det menneskelige øye, fordi du må behandle en million bilder på en gang, Sier Crawford. "Det vil til slutt endre måten vi ser på jorden, endre måten vi tenker på den, og endre måten vi tenker på å styre den."