science >> Wetenschap >  >> Elektronica

Maak kennis met Jaco en Baxter, machine learning-robots die perfecte hotdogs koken

Krediet:CC0 Publiek Domein

Zin in een hapje uit een vers gegrilde ballpark frank? Twee robots genaamd Jaco en Baxter kunnen er één serveren. Ingenieurs van de Boston University hebben een sprong gemaakt in het gebruik van machine learning om robots te leren complexe taken uit te voeren, een raamwerk dat kan worden toegepast op een groot aantal taken, zoals het identificeren van kankervlekken op mammogrammen of het beter begrijpen van gesproken commando's om muziek af te spelen. Maar eerst, als proof of concept:ze hebben geleerd hoe ze de perfecte hotdog moeten bereiden.

Onderzoekers begrijpen nog steeds niet precies hoe algoritmen voor machine learning - nou ja, leren. Die blinde vlek maakt het moeilijk om de techniek toe te passen op complexe, risicovolle taken zoals autonoom rijden, waar veiligheid voorop staat. In een stap voorwaarts gepubliceerd in Wetenschap Robotica , Calin Belta, een BU College of Engineering professor, en onderzoekers in zijn lab leerden twee robots koken, monteren, en serveer samen hotdogs. Hun methode combineert technieken uit machine learning en formele methoden, een gebied van informatica dat doorgaans wordt gebruikt om veiligheid te garanderen, met name gebruikt in avionica of cyberbeveiligingssoftware. Deze ongelijksoortige technieken zijn wiskundig moeilijk te combineren en samen te brengen in een taal die een robot begrijpt.

Belta, een professor in de mechanische, systemen, en elektrotechniek en computertechniek, en zijn team maakten gebruik van een tak van machine learning die bekend staat als versterkingsleren. Wanneer een computer een taak correct uitvoert, het ontvangt een beloning die het leerproces begeleidt. Hoewel de stappen van de taak worden beschreven in een "voorkennis"-algoritme, hoe u die stappen precies moet uitvoeren, is dat niet. Wanneer de robot beter wordt in het uitvoeren van een stap, zijn beloning neemt toe, het creëren van een feedbackmechanisme dat de robot ertoe aanzet om op de beste manier te leren, bijvoorbeeld, plaats een hotdog op een broodje.

Krediet:Universiteit van Boston

Het integreren van voorkennis met versterkend leren en formele methoden is wat deze techniek nieuw maakt. Door deze drie technieken te combineren, het team kan de hoeveelheid mogelijkheden verminderen die de robots moeten doorlopen om te leren koken, monteren, en serveer veilig een hotdog. Belta ziet dit werk als een proof-of-concept-demonstratie van hun algemene raamwerk, en hij hoopt dat het in de toekomst kan worden toegepast op andere complexe taken, zoals autonoom rijden.