https://frosthead.com

Denne pokerspillende AI vet når de skal holdes og når de skal brettes

Et dataprogram kalt Pluribus har bested poker proffene i en serie med seks spillere uten begrensning Texas Hold'em-spill, og nådd en milepæl i kunstig intelligensforskning. Det er den første bot som slo mennesker i en kompleks flerspiller-konkurranse.

Som forskere fra Facebooks AI-laboratorium og Carnegie Mellon University rapporterer i tidsskriftet Science, framsto Pluribus seirende i både menneskelig og algoritmedominerte kamper. Til å begynne med skriver Merrit Kennedy for NPR, fem versjoner av boten som ble møtt mot en profesjonell pokerspiller; i den neste runden med eksperimenter spilte en bot mot fem mennesker. I løpet av et Facebook-blogginnlegg vant AI i gjennomsnitt rundt $ 5 per hånd, eller $ 1000 per time, når de spilte mot fem menneskelige motstandere. Denne satsen anses som en "avgjørende seiermargin" blant profesjonelle pokerfolk.

Da han snakket med Kennedy, forklarte den fire ganger verdensmesteren i World Poker Tour Darren Elias at han hjalp til med å trene Pluribus ved å konkurrere mot fire tabeller med bot-rivaler og varsle forskere da AI gjorde en feil. Snart forbedret boten seg veldig raskt, og gikk fra å være en middelmådig spiller til i utgangspunktet en pokerspiller i verdensklasse i løpet av dager og uker. "Erfaringen, sier Elias, var" ganske skummel. "

I følge Verges James Vincent, behersket Pluribus - en overraskende rimelig AI som er trent med mindre enn $ 150 verdier til databehandlingsressurser - pokerstrategi ved å spille mot kopier av seg selv og lære gjennom prøving og feiling. Som Jennifer Ouellette noterer for Ars Technica, innså boten raskt at den beste handlingen var en kombinasjon av gameplay og uforutsigbare trekk.

De fleste menneskelige proffer unngår "donksatsing", som finner en spiller som avslutter en runde med en samtale og starter den neste med et spill, men Pluribus omfavnet lett den upopulære strategien. På samme tid, rapporterer Ouellette, ga AI også opp uvanlige innsatsstørrelser og viste bedre randomisering enn motstandere.

"Den viktigste styrken er evnen til å bruke blandede strategier, " sa Elias, ifølge en uttalelse fra CMU. “Det er det samme som mennesker prøver å gjøre. Det er et spørsmål om henrettelse for mennesker - å gjøre dette på en helt tilfeldig måte og å gjøre det konsekvent. De fleste kan ikke. "

Pluribus er ikke den første pokerspillende AI som beseirer profesjonelle mennesker. I 2017 utviklet botens skapere, Noam Brown og Tuomas Sandholm, en tidligere iterasjon av programmet kalt Libratus. Denne AI beseiret avgjørende fire pokerproffer på over 120 000 hender av to-spiller Texas Hold'em, men som Facebook-blogginnlegget forklarer, var det begrenset av det faktum at den bare møtte en motstander om gangen.

I følge MIT Technology Review 's Will Knight, utgjør poker en utfordring for AI fordi den involverer flere spillere og en mengde skjult informasjon. Til sammenligning involverer spill som sjakk og Go bare to deltakere, og spillernes posisjoner er synlige for alle.

For å overvinne disse hindringene opprettet Brown og Sandholm en algoritme utviklet for å forutsi motstandernes neste to eller tre trekk i stedet for å måle sine skritt gjennom slutten av spillet. Selv om denne strategien kan se ut til å prioritere kortsiktig gevinst fremfor langsiktige gevinster, er Verges Vincent skriver at "kortsiktig incisivitet virkelig er alt du trenger."

Fremover kan flerspillerprogrammer som Pluribus brukes til å designe medisiner som er i stand til å bekjempe antibiotikaresistente bakterier, samt forbedre cybersecurity og militære robot-systemer. Som Ars Technicas Ouellette bemerker at andre potensielle bruksområder inkluderer tilsyn med flerpartisforhandlinger, priser på produkter og brainstorming av auksjonsstrategier.

Foreløpig, sier Brown til Knight, vil algoritmen forbli i stor grad under omslag - hovedsakelig for å beskytte online pokerindustrien mot ødeleggende økonomiske tap.

Forskeren konkluderer, "Det kan være veldig farlig for pokersamfunnet."

Denne pokerspillende AI vet når de skal holdes og når de skal brettes