Wetenschap
Volledige pijplijn voor het trainen van het evaluatiemodel. Krediet:arXiv:1907.08321 [cs.LG]
Schaken en AI zijn weer in het nieuws, dit keer in rapporten over een team dat een model voor schaken verkent via natuurlijke taalverwerking (NLP). Het leermechanisme was schaakgebabbel - goed gekozen gebabbel. Ze trainden vooraf op commentaargevoelens die werden geassocieerd met schaakbewegingen. De gevoelens leidden de besluitvorming van de agent.
Hun resulterende schaakalgoritme was ontworpen om de kwaliteit van schaakzetten te evalueren door de reactie van deskundige commentatoren te analyseren.
De drie onderzoekers van University College London schreven een paper waarin ze hun methoden en resultaten beschrijven. Isaak Kamlish, Isaac Chocron en Nicholas McCarthy schreven "SentiMATE:Leren schaken door middel van natuurlijke taalverwerking, " en het staat op arXiv. De paper is vorige maand ingediend.
"We presenteren SentiMATE, een nieuw end-to-end Deep Learning-model voor schaken, gebruikmakend van natuurlijke taalverwerking die tot doel heeft een effectieve evaluatiefunctie te leren om de kwaliteit van de verplaatsing te beoordelen. Deze functie is vooraf getraind op het sentiment van commentaar in verband met de trainingsbewegingen, en wordt gebruikt om de besluitvorming van de agent te begeleiden en te optimaliseren."
Nodig AlphaZero en dit NLP-model niet uit voor hetzelfde feest; ze zouden aan weerszijden van de kamer blijven. De onderzoekers schreven dat AlphaZero van Deep Mind erin was geslaagd "na miljoenen herhalingen van zelfspelen en het gebruik van duizenden Tensor Processing Units (TPU's)." In het nieuwe onderzoek was dat niet het geval.
In plaats daarvan, ze zeiden, ze waren bedoeld om "de beoordeling van de kwaliteit van individuele bewegingen aan te pakken door het gebruik van natuurlijke taalverwerking ... Gegevens van verschillende Chess-websites werden geschraapt, die informatie bevatte over de bewegingen die werden gemaakt, en een kwalitatieve beoordeling van de bewegingen zelf in de vorm van commentaar, geschreven door een breed scala aan schakers; wat resulteert in een grote database van zetten met geannoteerd commentaar."
"Het evalueert de kwaliteit van schaakzetten door de reactie van deskundige commentatoren te analyseren, " zei Will Ridder, MIT Technology Review .
De onderzoekers schrapten commentaar dat geen betrekking had op hoogwaardige zetten en voorbeelden die te dubbelzinnig waren, hij voegde toe. "Vervolgens gebruikten ze een speciaal type terugkerend neuraal netwerk en woordinbedding (een wiskundige techniek die woorden verbindt op basis van hun betekenis), getraind op een ander state-of-the-art model voor het analyseren van taal."
Het algoritme, genaamd SentiMATE, werkte zelf de basisregels van het schaken uit, evenals verschillende belangrijke strategieën, waaronder forken en rokeren.
Het team ontdekte dat SentiMATE in staat was schaakzetten te evalueren "op basis van een vooraf getrainde functie voor het evalueren van sentimenten". Ze concludeerden dat er sterk bewijs was om te ondersteunen dat natuurlijke taalverwerking wordt gebruikt voor het trainen van een evaluatiefunctie in schaakmachines.
De prestaties van hun oplossing waren minder dan spectaculair. Ridder zei, "het slaagde er niet in om sommige conventionele schaakbots consequent te verslaan." Dat, echter, mag niet afleiden van het feit dat SentiMATE werkte, en de manier waarop het werkte:
"SentiMATE verraste de onderzoekers met zijn vermogen om enkele basisprincipes van schaken uit te werken, evenals verschillende belangrijke strategieën, zoals forken (wanneer twee of meer stukken tegelijkertijd worden bedreigd) en rokeren (wanneer de koning en het kasteel beide naar een meer defensieve positie op de achterkant van het bord gaan, " zeiden de auteurs.
Het belangrijkste is om te proberen een dergelijk programma te ontwerpen:kan taal dienen om te leren schaken met minder oefengegevens die nodig zijn dan bij conventionele benaderingen?
Tibi Puiu in ZME Wetenschap dacht daarover:
"Alleen deze keer, hun machine learning-programma oefende niet miljoenen spellen om het schaken onder de knie te krijgen, maar analyseerde eerder de taal van deskundige commentatoren. op een dag, de onderzoekers zeggen dat een vergelijkbare aanpak machines in staat zou kunnen stellen emotionele taal te ontcijferen en vaardigheden te verwerven die anders ontoegankelijk zouden zijn geweest met 'brute force'."
Wat betreft het model dat geen superschaakkampioen is, hij zei, "Prestaties op hoog niveau waren niet het doel, Hoewel. Waar SentiMATE uitblinkt, is het vermogen om taal te gebruiken om een vaardigheid te verwerven in plaats van deze te oefenen."
In hun krant de auteurs spraken over de uiterst belangrijke dataset ter ondersteuning van hun onderzoek. "Bij het opschonen en classificeren van de dataset op basis van commentaar, het bijten van de schaakbewegingen, en het toepassen van sentimentanalyse op het commentaar, we presenteren SentiChess een dataset van 15, 000 schaakzetten weergegeven in bitformaat, naast hun commentaar en sentiment evaluatie. Deze dataset wordt aangeboden in de hoop op verdere ontwikkeling van werk rond op sentiment gebaseerde schaakmodellen, en statistische bewegingsanalyse."
Vooruit gaan, Will Knight zei dat game-relevante chatter AI-programma's kan helpen het spel op een nieuwe manier te leren spelen. En, voorbij schaken, "Met dezelfde techniek kunnen machines de emotionele inhoud van onze taal gebruiken om verschillende praktische taken onder de knie te krijgen."
(Als de MIT Technology Review 's onderkop zei het, "Machines die 'briljante' en 'domme' schaakbewegingen waarderen, zouden kunnen leren om het spel - en andere dingen - efficiënter te spelen.")
© 2019 Wetenschap X Netwerk
Wetenschap © https://nl.scienceaq.com