science >> Wetenschap >  >> Elektronica

Hanabi:Facebook AI stapt over naar coöperatieve gameplay

Krediet:CC0 Publiek Domein

Het kaartspel Hanabi is als uitdaging aangenomen door de AI van Facebook, en het is nogal een uitdaging, aangezien ze een rijk betreden waar spelen niet alleen een kwestie is van de ene tegenstander die de andere verslaat, maar een "coöperatief" kaartspel waarbij een concurrerend team elkaar helpt.

Jonathan Vanian, Fortuin , leidde lezers door het spel als introductie:

"...:teams van twee tot vijf spelers krijgen willekeurige kaarten van verschillende kleuren en nummers die punten vertegenwoordigen. Het doel van teams is om de kaarten op een tafel te leggen, gegroepeerd op kleur, in de juiste numerieke volgorde. Het probleem, echter, is dat spelers hun eigen kaarten niet kunnen zien, terwijl hun teamgenoten dat wel kunnen. Een speler kan hints geven aan een ander, zoals een opmerking maken over een bepaalde kleur, dat zou de ander een tip geven om iets te doen zoals het spelen of weggooien van een kaart. Het dilemma is dat de speler moet afleiden wat de aanwijzing van zijn teamgenoot betekent."

Bedrijfsleiders hebben blijk gegeven van een neiging naar Hanabi als een leerervaring voor teambuilding; het heeft nu de aandacht getrokken van AI-onderzoekers die nadenken over het bouwen van opvallende AI-systemen.

"Bijna perfecte scores behalen op een obscuur Frans kaartspel is geweldig en behalve Facebook heeft alles grotere plannen voor zijn coöperatieve AI, " zei Engadget .

Facebook-onderzoeker, Tom Leer, werd geciteerd in Engadget :"Waar we naar kijken zijn kunstmatige agenten die beter kunnen redeneren over coöperatieve interacties met mensen en chatbots die kunnen redeneren waarom de persoon met wie ze chatten zei wat ze deden... Chatbots die beter kunnen redeneren waarom mensen zeggen wat ze doen zonder elk detail op te sommen van wat ze vragen, is een zeer eenvoudige toepassing van dit type zoektechniek."

Welke AI-strategieën hebben de onderzoekers ingezet?

Vanian identificeerde een zoektechniek die eerder door DeepMind werd gebruikt; het laat meerdere Hanabi-bots meerdere speelopties evalueren terwijl ze informatie met elkaar delen. Gecombineerd met versterkend leren, de Facebook-bots leerden hoe ze Hanabi met elkaar konden spelen.

De auteurs achter dit onderzoek schreven een paper waarin ze hun werk bespraken en het paper staat op arXiv (gepubliceerd in de Kunstmatige intelligentie logboek). "The Hanabi Challenge:A New Frontier for AI Research" is de titel van het artikel, en auteurs zeiden dat ze Hanabi aannamen als een "uitdagingsdomein met nieuwe problemen die voortkomen uit de combinatie van puur coöperatieve gameplay en imperfecte informatie in een setting van twee tot vijf spelers."

De auteurs merkten op dat het het best kan worden omschreven als een soort team Solitaire en dat de onvolmaakte informatie van het spel voortkomt uit het feit dat elke speler zijn eigen kaarten niet kan zien (degene die hij vasthoudt en waarnaar hij kan handelen), die elk een kleur en rang hebben.

Voor reproduceerbare onderzoeksresultaten, de auteurs hebben een open source Hanabi RL-omgeving uitgebracht, de Hanabi-leeromgeving, geschreven in Python en C++.

Elders, maar relevant voor hun doelen in reproduceerbaar onderzoek, Jerome Pesenti, vice-president AI bij Facebook, was in een recente Q&A met Will Knight in Bedrade .

Knight vroeg Pesenti naar het nabootsen van baanbrekend onderzoek.

"Het is iets waar Facebook AI erg gepassioneerd over is, " zei Pesenti. "Als mensen dingen doen die niet reproduceerbaar zijn, het zorgt voor veel uitdagingen. Als u het niet kunt reproduceren, het zijn veel verloren investeringen... Het mooie van AI is dat het uiteindelijk systemen zijn die door computers worden bestuurd. Het is dus een topkandidaat, als een deelgebied van de wetenschap, reproduceerbaar te zijn. Wij geloven dat de toekomst van AI iets zal zijn waar het bijna standaard reproduceerbaar is. We proberen het grootste deel van de code die we produceren in AI te openen, zodat andere mensen er bovenop kunnen bouwen."

De auteurs, in hun krant, hebben een sectie met de kruiskop "Hanabi:The Benchmark."

Deze onderzoeksinspanning gaat over het gebruik van Hanabi als een uitdagend benchmarkprobleem voor AI. Unieke eigenschappen onderscheiden het van andere benchmarks. "Het is een leerprobleem met meerdere agenten, in tegenstelling tot, bijvoorbeeld, de Arcade-leeromgeving. Het is ook een onvolmaakt informatiespel, waar spelers asymmetrische kennis hebben over de toestand van het milieu, waardoor het spel meer op poker lijkt dan op schaken, backgammon, of ga."

Andrew Tarantola in Engadget op dit punt opgepakt. Het leven in de echte wereld is geen nulsomspel zoals poker of Starcraft, hij zei, "en we hebben AI nodig om met ons samen te werken, niet tegen ons."

Twee Engadget reacties van lezers toonden geen ontzag voor wat er tot nu toe is bereikt. "Het is vrij zeker dat kennis hebben van hoe mensen gewoonlijk een enkel kaartspel spelen en algemene kennis van menselijke bedoelingen twee heel verschillende dingen zijn, " zei de een. Een ander zei dat "het identificeren van actiepatronen ver verwijderd is van theory of mind ... Je zou kunnen betogen als ze proberen de theory of mind toe te schrijven, hun nauwkeurigheid heeft werk nodig."

© 2019 Wetenschap X Netwerk