https://frosthead.com

The Turing Test of Computer Intelligence er for lett

Alan Turing, en engelsk matematiker som spilte en nøkkelrolle som kodebryter under andre verdenskrig, blir noen ganger kalt dataprogrammeringens far. Han er kjent for å ha foreslått en test for dataintelligens som var basert på et salongspill der en spørsmåler prøvde å utlede kjønnet til to personer bak en gardin. Salongspillet var enkelt: Skriftlige spørsmål og svar ble gitt frem og tilbake slik at tone og tonehøyde ikke forrådte menneskene bak gardinen. Turings foreslåtte test bytter en av de skjulte personene for en datamaskin. Spillet er å finne ut hvilken gardin som skjuler et menneske, og som skjuler kunstig intelligens.

Vi kaller dette Turing-testen, og det spilles vanligvis ut på en datamaskin gjennom en samtale med en chatbot. Den siste sommeren overbeviste 33 prosent av dommerne om at det var menneske, en program som etterlater en 13 år gammel ukrainsk gutt, "Eugene Goostman", melder Dan Falk for Smithsonian .

Turing optimistisk spådde at innen år 2000 et dataprogram ville lure dommerne 30 prosent av tiden. Men foreløpig sliter de fleste chatbots med å virkelig "lyde" menneskelig. Årets bragd ble møtt med kritikk, fordi Eugene kan skjule sin natur bak feilene en tenåring som ikke snakker perfekt engelsk kan gjøre. Falk skriver:

I en av samtalene mine i 2012 skrev jeg inn en enkel vits - og enheten jeg snakket med, endret emnet øyeblikkelig til hamburgere. (Dataforskeren Scott Aaronson hadde nylig en lignende opplevelse da han chatte med Eugene via botens hjemmeside. Aaronson spurte Eugene hvor mange bein en kamel har; den svarte: "Noe mellom 2 og 4. Kanskje tre? :-)))" Senere, da Aaronson spurte hvor mange bein en maur har, hostet Eugene nøyaktig samme svar, trippel-smiley og alt.)

Hvis folk kan lure av en datamaskin som tuter tull - ikke akkurat et tegn på intelligens - så burde vi sannsynligvis komme med en bedre måte å teste AI Gå inn i Lovelace Test, oppkalt etter Ada Lovelace, den første dataprogrammereren.

Lovelace skrev i 1843 at datamaskiner ikke kan betraktes som intelligente før de kan lage noe originalt, noe de ikke var programmert til å gjøre, rapporterer Jordan Pearson for Motherboard. Lovelace-testen ble først foreslått i 2001, men Mark Riedl, en AI-forsker, forklarer at denne testen, som opprinnelig tenkt, heller ikke er perfekt. "Jeg er ikke sikker på at testen faktisk fungerer fordi det er veldig usannsynlig at programmereren ikke kunne finne ut hvordan AI-en deres skapte noe, " sa han til New Scientist .

Oppdateringen hans, Lovelace 2.0-testen, ville ganske enkelt be datamaskinen lage noe originalt og kreativt: en historie, dikt eller et bilde. Han skriver:

Hvis dommeren er fornøyd med resultatet, ber de en annen, vanskeligere, forespørsel. Dette fortsetter til AI blir bedømt å ha sviktet en oppgave, eller dommeren er fornøyd med at den har vist tilstrekkelig etterretning. Flere runder betyr at du får en score i motsetning til en pasning eller mislykkes. Og vi kan registrere en dommer sine forskjellige forespørsler, slik at de kan testes mot mange forskjellige AI-er

Testen fungerer mer som et sammenligningsverktøy mellom AI-systemer, sier New Scientist . Men det virker i det minste som om det ikke lar seg lure av triks slik Turing-testen kan. Også verdt å merke seg: estetikken i skapelsen betyr ikke noe. Tross alt, ikke alle levende, pustende mennesker kan male mesterverk. Men de fleste kan spille Pictionary, påpeker Riedl.

The Turing Test of Computer Intelligence er for lett