science >> Wetenschap >  >> Elektronica

MIT-robot combineert visie en aanraking om het spel van Jenga . te leren

Jenga! #RoboFail. Krediet:Fazeli et al., Wetenschap. Robot. 4, eaav3123 (2019)

In de kelder van MIT's Building 3, een robot overweegt zorgvuldig zijn volgende zet. Het prikt zachtjes in een toren van blokken, op zoek naar het beste blok om eruit te halen zonder de toren omver te werpen, in een eenzame, langzaam bewegend, maar verrassend behendig spel van Jenga.

De robot, ontwikkeld door MIT-ingenieurs, is uitgerust met een zachte grijper, een krachtgevoelige polsmanchet, en een externe camera, die het allemaal gebruikt om de toren en zijn afzonderlijke blokken te zien en te voelen.

Terwijl de robot voorzichtig tegen een blok duwt, een computer ontvangt visuele en tactiele feedback van zijn camera en manchet, en vergelijkt deze metingen met bewegingen die de robot eerder maakte. Het houdt ook rekening met de resultaten van die bewegingen, met name of een blok, in een bepaalde configuratie en met een bepaalde kracht geduwd, succesvol is geëxtraheerd of niet. Live, de robot "leert" dan of hij moet blijven duwen of naar een nieuw blok moet gaan, om te voorkomen dat de toren valt.

Details van de Jenga-spelende robot zijn gepubliceerd in het tijdschrift Wetenschap Robotica . Alberto Rodríguez, de Walter Henry Gale-assistent-professor voor loopbaanontwikkeling bij de afdeling Werktuigbouwkunde aan het MIT, zegt dat de robot iets demonstreert dat in eerdere systemen lastig te bereiken was:het vermogen om snel de beste manier te leren om een ​​taak uit te voeren, niet alleen door visuele aanwijzingen, zoals het tegenwoordig algemeen wordt bestudeerd, maar ook van tactiele, fysieke interacties.

"In tegenstelling tot meer puur cognitieve taken of spellen zoals schaken of Go, het spelen van het spel van Jenga vereist ook beheersing van fysieke vaardigheden zoals sonderen, duwen, trekken, plaatsen, en uitlijnen van stukken. Het vereist interactieve perceptie en manipulatie, waar je heen moet en de toren moet aanraken om te leren hoe en wanneer je blokken moet verplaatsen, " zegt Rodriguez. "Dit is heel moeilijk te simuleren, dus de robot moet leren in de echte wereld, door interactie met de echte Jenga-toren. De belangrijkste uitdaging is om te leren van een relatief klein aantal experimenten door gebruik te maken van gezond verstand over objecten en natuurkunde."

Hij zegt dat het tactiele leersysteem dat de onderzoekers hebben ontwikkeld, kan worden gebruikt in toepassingen buiten Jenga, vooral bij taken die zorgvuldige fysieke interactie vereisen, inclusief het scheiden van recyclebare voorwerpen van het afval op de stortplaats en het samenstellen van consumentenproducten.

Een video met commentaar van de robot die Jenga leert spelen zoals een mens zou doen. (Duur:11:21), 0:00 – 2:08 Verkenningsfase, 2:09 – 11:21 Optreden na de training. Krediet:Fazeli et al., Wetenschap. Robot. 4, eaav3123 (2019)

"In een lopende band voor mobiele telefoons, in bijna elke stap, het gevoel van een snap-fit, of een schroefdraad, komt van kracht en aanraking in plaats van visie, " zegt Rodriguez. "Het leren van modellen voor die acties is het belangrijkste onroerend goed voor dit soort technologie."

De hoofdauteur van het artikel is MIT-afgestudeerde student Nima Fazeli. Het team omvat ook Miquel Oller, Jiajun Wu, Zheng Wu, en Jozua Tenenbaum, hoogleraar hersen- en cognitieve wetenschappen aan het MIT.

Duwen en trekken

In het spel Jenga - Swahili voor "bouwen" - worden 54 rechthoekige blokken gestapeld in 18 lagen van elk drie blokken, met de blokken in elke laag loodrecht op de blokken eronder georiënteerd. Het doel van het spel is om voorzichtig een blok eruit te halen en op de top van de toren te plaatsen, dus een nieuw niveau bouwen, zonder de hele structuur omver te werpen.

Om een ​​robot te programmeren om Jenga te spelen, traditionele machinale leerschema's vereisen mogelijk het vastleggen van alles wat mogelijk kan gebeuren tussen een blok, de robot, en de toren - een dure rekentaak die gegevens vereist van duizenden, zo niet tienduizenden pogingen tot blokextractie.

In plaats daarvan, Rodriguez en zijn collega's zochten naar een meer data-efficiënte manier voor een robot om Jenga te leren spelen, geïnspireerd door menselijke cognitie en de manier waarop we zelf het spel zouden kunnen benaderen.

Een video met commentaar van de robot die een ander spelletje Jenga leert spelen, met een resettoren. 0:00 – 1:17 Verkenningsfase, 1:18 – 2:49 Mislukkingen en bloopers bij verkenning, 2:50 – 11:47 Optreden na de training. Krediet:Fazeli et al., Wetenschap. Robot. 4, eaav3123 (2019)

Het team heeft een industriestandaard ABB IRB 120 robotarm aangepast, zet dan een Jenga-toren op binnen het bereik van de robot, en begon een trainingsperiode waarin de robot eerst een willekeurig blok koos en een locatie op het blok waartegen hij moest duwen. Vervolgens oefende het een kleine hoeveelheid kracht uit in een poging het blok uit de toren te duwen.

Voor elke blokpoging, een computer registreerde de bijbehorende visuele en krachtmetingen, en gelabeld of elke poging een succes was.

In plaats van tienduizenden van dergelijke pogingen uit te voeren (wat zou betekenen dat de toren bijna net zo vaak zou moeten worden gereconstrueerd), de robot trainde op ongeveer 300, met pogingen tot vergelijkbare metingen en resultaten gegroepeerd in clusters die bepaald blokgedrag vertegenwoordigen. Bijvoorbeeld, een cluster van macht staat voor pogingen op een blok dat moeilijk te verplaatsen was, versus een die gemakkelijker te verplaatsen was, of die de toren omver wierp bij verplaatsing. Voor elk datacluster, de robot ontwikkelde een eenvoudig model om het gedrag van een blok te voorspellen gezien de huidige visuele en tactiele metingen.

Fazeli zegt dat deze clustertechniek de efficiëntie waarmee de robot het spel kan leren spelen drastisch verhoogt. en is geïnspireerd door de natuurlijke manier waarop mensen soortgelijk gedrag clusteren:"De robot bouwt clusters en leert vervolgens modellen voor elk van deze clusters, in plaats van een model te leren dat absoluut alles vastlegt wat er zou kunnen gebeuren."

Opstapelen

De onderzoekers testten hun aanpak tegen andere state-of-the-art machine learning-algoritmen, in een computersimulatie van het spel met behulp van de simulator MuJoCo. De lessen die in de simulator zijn geleerd, hebben de onderzoekers geïnformeerd over de manier waarop de robot in de echte wereld zou leren.

Jenga-spelende robot. Krediet:Fazeli et al., Wetenschap. Robot. 4, eaav3123 (2019)

"We leveren aan deze algoritmen dezelfde informatie die ons systeem krijgt, om te zien hoe ze Jenga op een vergelijkbaar niveau leren spelen, " zegt Oller. "Vergeleken met onze aanpak, deze algoritmen moeten orden van grootte meer torens verkennen om het spel te leren."

Benieuwd hoe hun machine learning-aanpak zich verhoudt tot echte menselijke spelers, het team voerde enkele informele proeven uit met enkele vrijwilligers.

"We zagen hoeveel blokken een mens eruit kon halen voordat de toren viel, en het verschil was niet zo veel, "zegt Oller.

Maar er is nog een weg te gaan als de onderzoekers hun robot competitief willen opnemen tegen een menselijke speler. Naast fysieke interacties, Jenga vereist strategie, zoals het uitpakken van precies het juiste blok waardoor het voor een tegenstander moeilijk wordt om het volgende blok eruit te trekken zonder de toren omver te werpen.

Voor nu, het team is minder geïnteresseerd in het ontwikkelen van een robot Jenga-kampioen, en meer gericht op het toepassen van de nieuwe vaardigheden van de robot op andere toepassingsdomeinen.

"Er zijn veel taken die we met onze handen doen waarbij het gevoel om het 'op de juiste manier' te doen komt in de taal van krachten en tactiele signalen, " zegt Rodriguez. "Voor taken als deze, een vergelijkbare aanpak als de onze zou het kunnen oplossen."

Dit onderzoek werd ondersteund, gedeeltelijk, door de National Science Foundation via het National Robotics Initiative.