science >> Wetenschap > >> Elektronica

De robothand van OpenAI maakt de bewegingen voor de Rubiks-kubus

Degenen die weten hoe moeilijk het is om robothanden vast te pakken, handvat en manoeuvre zullen meer doen dan kijken - staren, eerder - bij de recente video die de OpenAI Dactyl Rubik's kubus laat zien.

Werken met een robothand met vier vingers en duim is nooit triviaal als het de uitdaging is om menselijke vingervaardigheid te demonstreren. De hand van OpenAI wint waarderende blikken met zijn behendige vingermanipulaties die een menselijke hand nodig zou hebben om de kubus op te lossen.

Degenen die bekend zijn met de andere video van OpenAI die vorig jaar is gepost, zouden al op de hoogte zijn van hun vorderingen, met de video genaamd Learning Dexterity. De video ging over het trainen van een mensachtige robothand om fysieke objecten te manipuleren. Zelfs toen hadden ze het gevoel dat ze konden opscheppen dat de robothand dit met 'ongekende behendigheid' kon doen.

Zo introduceerden ze hun systeem, Dactylus. Ze zeiden dat Dactyl helemaal opnieuw leert met behulp van een algemeen leeralgoritme en code voor versterking. "Onze resultaten laten zien dat het mogelijk is om agenten te trainen in simulatie en ze real-world taken te laten oplossen, zonder fysiek nauwkeurige modellering van de wereld."

Een machine learning-engineer vertelde videokijkers dat de techniek domeinrandomisatie werd genoemd.

Ze hebben gerandomiseerd hoe snel de hand kan bewegen, bijvoorbeeld, en hoe zwaar het blok is, en de wrijving tussen het blok en de hand.

Twee opmerkingen van de video van een jaar geleden dachten dat dit niet echt AI was:"'AI' is op dit moment eigenlijk alleen maar geabstraheerde algoritmen. We begrijpen niet eens wat intelligentie is, laat staan hoe het te synthetiseren."

De andere opmerking:"Dit is niets meer dan slim programmeren ... helemaal geen intelligentie. Dit is gewoon een machine die doet waarvoor hij is geprogrammeerd, op een ronde manier. Programmeer gewoon het ding om de blokken op de juiste manier te draaien vanaf het begin en bespaar jezelf wat tijd en moeite... Een computer doet alleen waarvoor hij is geprogrammeerd."

Nog altijd, Karen Hao MIT Technology Review dacht dat de robothand van het team een belangrijke stap was in de richting van meer wendbare robots voor industriële en consumententoepassingen.

Snel vooruit naar hun nieuwe krant, "Ruiks kubus oplossen met een robothand."

De auteurs legden uit:"We laten zien dat modellen die alleen in simulatie zijn getraind, kunnen worden gebruikt om een manipulatieprobleem van ongekende complexiteit op een echte robot op te lossen. Dit wordt mogelijk gemaakt door twee belangrijke componenten:een nieuw algoritme, die we automatische domeinrandomisatie (ADR) noemen en een robotplatform dat is gebouwd voor machine learning."

Ze spraken over hun gecombineerde flip- en topface-rotatie.

"Een rotatie komt overeen met het 90 graden draaien van een enkel vlak van de Rubiks kubus met de klok mee of tegen de klok in. Een omwenteling komt overeen met het verplaatsen van een ander vlak van de Rubiks kubus naar de bovenkant. We vonden het verdraaien van het bovenvlak ver eenvoudiger dan het draaien van andere vlakken. in plaats van willekeurige gezichten te roteren, we combineren een flip en een rotatie van het bovenvlak om de gewenste operatie uit te voeren. Deze subdoelen kunnen dan achtereenvolgens worden uitgevoerd om uiteindelijk de Rubiks kubus op te lossen."

Ze gingen in op alle vermoedens dat ze zichzelf een oneerlijk voordeel gaven met een ideaal vervormde kubus.

"De moeilijkheid om een Rubiks kubus op te lossen hangt natuurlijk af van hoeveel het eerder is gescrambled. We gebruiken de officiële scramble-methode die wordt gebruikt door de World Cube Association om te verkrijgen wat zij een eerlijke scramble noemen (ongeveer 20 zetten die worden toegepast op een Rubiks kubus opgelost om het door elkaar te gooien).

Wat vonden andere robotici van de hand van het OpenAI-team met het puzzelspel Rubik's?

Hao citeerde Dmitry Berenson, een roboticus aan de Universiteit van Michigan.

"Dit is een heel moeilijk probleem, " zei hij. "Het soort manipulatie dat nodig is om de onderdelen van de Rubiks kubus te roteren is eigenlijk veel moeilijker dan om een kubus te roteren."

Maar wat bedoelt het team als ze verwijzen naar modellen die zijn getraind in simulatie? Karen Hao MIT Technology Review zeiden dat ze een virtueel model van hun robot bouwen. Ze trainen het virtueel om de taak uit te voeren. "Het algoritme leert in de veiligheid van de digitale ruimte en kan daarna worden overgezet naar een fysieke robot." Nutsvoorzieningen, de sleutel tot hun succes:Ho zei:"het laboratorium vervormde de gesimuleerde omstandigheden in elke trainingsronde om het algoritme beter aan te passen aan verschillende mogelijkheden."

Ze gebruikten de (1) Shadow Dexterous E Series Hand als robothand, (2) het PhaseSpace motion capture-systeem om de cartesiaanse coördinaten van de vingertoppen te volgen en (3) drie RGB Basler-camera's werden gebruikt voor de schatting van de visie.

Wat is het volgende?

In een weblog, teamleden verklaarden dat "Het oplossen van de Rubik's Cube met een robothand nog steeds niet eenvoudig is. Onze methode lost momenteel de Rubik's Cube 20% van de tijd op bij het toepassen van een maximaal moeilijke scramble die 26 gezichtsrotaties vereist. Voor eenvoudiger scrambles die 15 rotaties vereisen om ongedaan maken, het slagingspercentage is 60%.

Niettemin, OpenAI gaat niet over het weglopen van moeilijkheden. "Wij geloven dat behendigheid op menselijk niveau op weg is naar het bouwen van robots voor algemeen gebruik en we zijn verheugd om in deze richting vooruit te gaan."

Robots sneller grip geven

Baanbrekend onderzoek maakt 3D-geprinte chocolade mogelijk zonder temperatuurregeling

Hoofdlijnen

Wetenschap

Elektronica
Biologie
Zonsverduistering
Wiskunde
French | Italian | Spanish | Portuguese | Swedish | German | Dutch | Danish | Norway |