https://frosthead.com

Siste AI lærer seg selv å leke uten menneskelig hjelp

I fjor slo et kunstig intelligensprogram kalt AlphaGo opprettet av Googles DeepMind-team en menneskelig mester på Go, et gammelt kinesisk strategispill som på mange måter er mer sammensatt enn sjakk. Som Emily Matchar rapporterte for Smithsonian.com den gangen, var det en fantastisk prestasjon, siden så sent som i 1997 var det noen som spådde at det ville ta 100 år før en datamaskin slo et menneske på Go.

Mens bragden er imponerende, lærte AlphaGo å spille spillet ved å analysere tidligere spill spilt av mennesker. Men som Merrit Kennedy hos NPR rapporterer, har en ny versjon av kunstig intelligens kalt AlphaGo Zero funnet ut hvordan man mestrer spillet på egen hånd, uten menneskelig innspill eller manipulasjon - et fremskritt som har store implikasjoner for fremtidig AI-utvikling.

I følge en pressemelding fra DeepMind lærte tidligere versjoner av AlphaGo å spille spillet ved å studere kamper mellom profesjonelle og sterke amatørspillere, absorbere spillereglene og vellykkede spillstrategier. AlphaGo Zero så imidlertid ikke på noen spill som ble spilt av mennesker. I stedet ble det gitt spillereglene og deretter spilt mot seg selv, ved å bruke forsterkningslæring for å lære seg selv riktige og gale trekk og langsiktige strategier. Da AI spilte spillet, oppdaterte den sitt avanserte nevrale nettverk for bedre å forutsi motstanderens trekk.

Forskerne så på da AI mestret spillet i sanntid. Etter tre dager var det i stand til å beseire en tidligere versjon kalt AlphaGo Lee, som slo koreanske Go-mester Lee Sedol i 4 av 5 kamper i 2016. Etter 21 dager bested den AlphaGo Master, versjonen som slo 60 topp Go-spillere online og verdens beste spiller Ke Jie tidligere i år. Den siste versjonen bestilte AlphaGo Master 100-spill til 0. Etter 40 dager nådde den nivåer på spill ingen har sett før. Forskningen vises i tidsskriftet Nature.

"På kort tid har AlphaGo Zero forstått all Go-kunnskapen som har blitt akkumulert av mennesker gjennom tusenvis av år med å spille, " sier forsker David Silver fra Googles DeepMind i en Youtube-video. "Noen ganger er det faktisk valgt å gå utover det og oppdaget noe som menneskene ikke en gang hadde oppdaget i denne tidsperioden, og oppdaget nye kunnskaper som er kreative og nye på mange måter."

Som Agence France-Presse rapporterer, nådde AlphaGo Zero dette mestringsnivået mye mer effektivt enn forgjengerne. Mens den forrige iterasjonen hadde 48 databehandlingsenheter og spilte 30 millioner treningsspill i løpet av flere måneder, hadde Zero bare 4 behandlingsenheter og spilte 4, 9 millioner treningsspill i løpet av tre dager. "Folk har en tendens til å anta at maskinlæring handler om big data og enorme mengder beregning, men det vi så med AlphaGo Zero er faktisk at algoritmer betyr mye mer, " sier Silver til AFP.

Men forskningen handler om mer enn bare å mestre et brettspill. Som Ian Sample på The Guardian rapporterer, denne typen tabula rasa, eller blank skifer, læring kan føre til en ny generasjon kunstig intelligens med generell bruk som kan bidra til å løse problemer i felt som kan simuleres godt i en datamaskin, som legemiddelsammensetning, proteinfolding eller partikkelfysikk. Ved å bygge sin kunnskap fra grunnen av uten menneskelige skjevheter eller begrensninger, kunne algoritmene gå i retninger mennesker ennå ikke har tenkt å se ut.

Mens mange mennesker i AI-samfunnet ser AlphaGo Zero som en stor bragd, forteller Gary Marcus, psykologiprofessor ved New York University som spesialiserer seg i kunstig intelligens, til NPRs Kennedy at han ikke tror algoritmen virkelig er tabula rasa fordi forutgående menneskelig kunnskap gikk inn i konstruksjonen av algoritmen. Han synes heller ikke tabula rasa AI er så viktig som det virker. "[I] biologi er faktisk menneskelige hjerner ikke tabula rasa ... Jeg ser ikke den viktigste teoretiske grunnen til at du skal gjøre det, hvorfor du skal forlate mye kunnskap som vi har om verden, " sier han.

Likevel er Alpha Gos raske mestring av spillet imponerende - og litt skremmende.

Siste AI lærer seg selv å leke uten menneskelig hjelp