science >> Wetenschap >  >> Elektronica

Hoe poker en andere spellen kunstmatige intelligentie helpen evolueren

Menselijke kampioenen verslaan in complexe spellen zoals dammen, poker en Go is een ideale uitdaging voor kunstmatige intelligentie - en een opstap naar uitgebreide toepassingen buiten de speelkamer, zeggen UAlberta-experts. Krediet:Universiteit van Alberta

Toen hij opgroeide in Ohio, zijn ouders waren fervente kaartspelers, handen uitdelen van alles, van euchre tot gin rummy. In de tussentijd, hij en zijn vrienden verscheurden bordspellen die rond het ouderlijk huis lagen en combineerden de stukken om hun eigen spellen te maken, met nieuwe uitdagingen en nieuwe markeringen voor de overwinning.

Bowlen is ver verwijderd van zijn dagen van spelen met kleurrijke kaarten en plastic dobbelstenen. Hij heeft drie graden in informatica en is nu professor aan de Universiteit van Alberta.

Maar, in zijn hart, Bowlen houdt nog steeds van spelletjes spelen. Zijn onderzoek naar kunstmatige intelligentie - en hoe het samengaat met games en machine learning - heeft hem in de voorhoede van het snel evoluerende veld geplaatst.

"Games zijn zo'n prachtige microkosmos van interessante besluitvormingsproblemen, " hij zegt.

"Voor een moment), je kunt het als een op zichzelf staand ding houden, waar je kunstmatige intelligentie-agenten naar de wereld van het spel kijken en proberen het op te lossen. Op dezelfde manier, het is leuk voor mensen om dat spel een minuutje te spelen en hun werelden daarop te vereenvoudigen."

Bowling leidt de Computer Poker Research Group van de universiteit, waar hij vorig jaar met een team een ​​probleem oploste dat ooit onoplosbaar werd geacht:de groep ontwikkelde een algoritme dat professionele pokerspelers verslaat in no-limit Texas hold 'em poker.

Het heet DeepStack. Het succes ervan wordt beschouwd als een nieuwe mijlpaal in onderzoek naar kunstmatige intelligentie, waar complexe algoritmen vaak beginnen bij wetenschappers die kaartspellen gebruiken, bordspellen en videospellen als proeftuinen.

Van schijven tot het menselijk genoom

In 1989, informaticus Jonathan Schaeffer kwam op het idee om een ​​computerprogramma te schrijven, Chinook, om het wereldkampioenschap dammen/dammen te winnen.

Terwijl mensen in de dammengemeenschap geïntrigeerd waren door de nieuwigheid van een computer die deelnam aan hun toernooien, ze waren verrast toen, in zijn tweede toernooi, Chinook verdiende het recht om te spelen voor het Wereldkampioenschap.

De bestuursorganen van werelddammen verzetten zich aanvankelijk tegen het idee van een computer die om het wereldkampioenschap zou spelen, maar de topfederaties van het spel gaven uiteindelijk toe - enigszins - en vormden een nieuw evenement:het Man vs. Machine Wereldkampioenschap.

1992, Chinook verloor van Marion Tinsley, die vorig jaar met pensioen was gegaan als wereldkampioen dammen. Maar in een rematch in 1994, het programma overheerste. Chinook werd het eerste programma dat een wereldkampioenschap voor mensen won in welk spel dan ook, een prestatie erkend door het Guinness Book of World Records.

Die strijd tussen mens en machine speelt zich in de decennia sinds:in 1997 steeds weer af. IBM's Deep Blue, mede-auteur van U of A-alumnus Murray Campbell en twee anderen, versloeg wereldkampioen schaken Garry Kasparov; in 2011, IBM's Watson nam een ​​$ 1 miljoen Jeopardy mee naar huis! kampioenschap; en vorig jaar, AlphaGo werd het eerste computerprogramma dat een mens versloeg in het complexe bordspel, Gaan.

Schaeffer, nu decaan van de faculteit Bètawetenschappen van de U of A, doet sinds 1979 onderzoek naar kunstmatige intelligentie.

"Ik doe AI-onderzoek. En een van de tests die ik gebruik, het meest populair bij studenten, toevallig spelen. En als de ideeën goed zijn, ze kunnen worden toegepast op andere toepassingen."

Schaeffer geniet duidelijk van het plezier van een spel, de concurrentie en de brede aantrekkingskracht van het werken aan iets waar zovelen zich mee kunnen identificeren. Maar hij is ook duidelijk dat game-onderzoek gevolgen kan hebben die veel verder gaan dan een pak kaarten of een speelbord.

Hij wijst op iets dat alomtegenwoordig is in het moderne leven:het GPS-systeem. En de techniek erachter verbindt hij met de Rubik's Cube.

"De Rubik's Cube is door elkaar gegooid. Het is je 'start' en je probeert een positie te bereiken waar alles op zijn plaats is. Wat is de route om van het ene punt naar het andere te gaan? Beschouw elke zet (in het spel) als onderdeel van uw reis, en u wilt zo snel mogelijk van begin tot eind komen - en dat is precies wat de GPS doet.

"Ik zou graag denken dat sommige van de ideeën die we hier hebben gegenereerd, worden gebruikt in GPS-systemen. Dat weten we niet zeker. Ons werk is openbaar en bedrijven hoeven niet openbaar te maken wat ze in hun producten stoppen."

Jonathan Schaeffer ontwikkelde Chinook, een damspelprogramma dat in 1994 voormalig wereldkampioen Marion Tinsley versloeg - het eerste programma dat een menselijk wereldkampioenschap won in welk spel dan ook. Krediet:Richard Siemens

Schaeffers werk aan Chinook omvatte een enorme hoeveelheid rekenkracht die gegevens moest organiseren en comprimeren tot iets heel kleins. Het programma moest ook snel informatie vinden, tussen de biljoenen datapunten die zijn gecomprimeerd.

Kort na het wereldkampioenschap van Chinook, een bioloog kwam in het kantoor van Schaeffer. Hij werkte aan het menselijk genoomproject, waarbij ook een enorme hoeveelheid data betrokken was. Hij moest die gegevens ook comprimeren, en elementen snel te identificeren.

Een jaar later, een bedrijf genaamd BioTools opgericht om het menselijk genoomproject te ondersteunen. Sommige van de ideeën die in hun producten werden gebruikt, kwamen uit het damonderzoek.

"Het was een van die aangename verrassingen, volkomen onverwacht, uit het linkerveld komen."

De 'intuïtieve' machine bouwen

Het recente werk van de U of A om no-limit Texas hold 'em poker onder de knie te krijgen is geland in de maart 2017-editie van het prestigieuze tijdschrift Wetenschap . Wat de prestatie baanbrekend maakte, is dat het spel een "onvolmaakte informatie" -scenario is - in tegenstelling tot schaken of dammen, waar beide spelers alles op tafel kunnen zien, spelers in poker houden sommige kaarten voor zichzelf.

De uitdaging voor Bowling en zijn team was om een ​​'intuïtie' voor DeepStack te ontwikkelen.

"Onze algoritmen moeten diep nadenken over wat de andere agent op dit moment over mijn kaarten KAN weten en wat ik over hun kaarten kan weten. De redenering moet overtuigingen omvatten en niet alleen wat je op tafel kunt zien."

Om dat onderbuikgevoel te ontwikkelen, die "intuïtie, " Bowling en zijn team moesten DeepStack door tientallen miljoenen pokerscenario's leiden. Het programma begon sommige situaties als goed en sommige als slecht te herkennen, sommige als minder goed of minder slecht.

Dit bouwde de algemene ervaring van DeepStack op, en het begon nieuwe situaties te herkennen als verschillende gradaties van goed of slecht - en liet het toe om op basis daarvan de beste toneelstukken te bedenken.

Het team bewees de competentie van DeepStack door het te laten spelen tegen enkele van de beste pokerspelers ter wereld. Ze speelden zoveel handen dat de bevindingen statistisch significant waren.

Op de vraag of DeepStack poker in wezen zal doden, wie wil er tegen een machine spelen als het gegarandeerd is dat de machine zal winnen? — Punten bowlen voor schaken.

"Dat werd gezegd over schaken en nu zijn er misschien meer grootmeesters dan ooit... het lijkt het vaardigheidsniveau te hebben versneld, " hij zegt, Merk op dat amateurs tegen de beste computers kunnen spelen om hun vaardigheden aan te scherpen en er zijn competities waarbij schakers samenwerken met computers om de competitie te verbeteren.

Maar hij erkent ook dat poker een beetje anders is. Mensen spelen poker voor geld. Het is een gokactiviteit, en het heeft geen zin om te spelen tegen een entiteit die statistisch gezien waarschijnlijk zal winnen.

"Misschien betekent dat dat poker iets anders begint te worden dan alleen maar een pure gokactiviteit... Ik hoop dat het het spel misschien van het gokstuk zal verwijderen. Laten we proberen erachter te komen wie de beste spelers ter wereld zijn en misschien kunnen we begin dit te benadrukken voor wat het is, een op vaardigheden gebaseerde activiteit."

Bowling begon zijn werk aan DeepStack met de benadering die de meeste "echte" problemen zijn, in feite, onvolmaakte informatiescenario's.

Maar zijn werk wordt niet alleen gedreven door hoe zijn AI-doorbraken kunnen worden toegepast buiten het domein van games.

"Als we door willen gaan om meer capabele kunstmatige intelligentie te zien, het kan een afleiding zijn om te zeggen, 'Hier is een applicatie waarmee je veel geld kunt verdienen.' Is dat echt de weg om ons beter te maken, meer capabele kunstmatige intelligentie?

"Er zouden mensen moeten zijn die doorzetten op het pad voor de langere termijn, die het doorschuiven naar het volgende zonder er zeker van te zijn dat het een activiteit zal zijn om geld te verdienen."