science >> Wetenschap >  >> Elektronica

Een robothand kan jongleren met een kubus - met veel training

Deze ongedateerde foto van OpenAI toont een robothand die een kubus vasthoudt in het onderzoekslaboratorium van het bedrijf in San Francisco. De hand, genaamd Dactyl, heeft een enkele baan, en dat is om een ​​kubus te draaien totdat de letter die naar boven wijst overeenkomt met een willekeurige selectie. (Eric Louis Haines/OpenAI via AP)

Hoe lang duurt het voordat een robothand leert jongleren met een kubus?

Ongeveer 100 jaar, Ongeveer.

Zo veel virtuele rekentijd kostte onderzoekers van OpenAI, het non-profit laboratorium voor kunstmatige intelligentie, gefinancierd door Elon Musk en anderen, om zijn lichaamloze hand te trainen. Het team betaalde Google $ 3, 500 om zijn software op duizenden computers tegelijk te laten draaien, het kraken van de werkelijke tijd tot 48 uur. Na het trainen van de robot in een virtuele omgeving, het team heeft het in de echte wereld op de proef gesteld.

De hand, genaamd Dactyl, leerde zichzelf te bewegen, maakte het team van twee dozijn onderzoekers deze week bekend. Het is zijn taak om de kubus zo aan te passen dat een van zijn letters - "O, " ''P, "'E, " ''N, " ''A" of "I'' - naar boven gericht om overeen te komen met een willekeurige selectie.

Ken Goldberg, een universiteit van Californië, Berkeley robotica professor die niet is aangesloten bij het project, zei dat de prestatie van OpenAI een groot probleem is omdat het laat zien hoe robots die zijn getraind in een virtuele omgeving in de echte wereld kunnen werken. Zijn lab probeert iets soortgelijks met een robot genaamd Dex-Net, hoewel zijn hand eenvoudiger is en de objecten die hij manipuleert complexer.

Deze ongedateerde foto van OpenAI toont een robothand die een kubus ronddraait in het onderzoekslaboratorium van het bedrijf in San Francisco. De hand, genaamd Dactyl, heeft een enkele baan, en dat is om een ​​kubus te draaien totdat de letter die naar boven wijst overeenkomt met een willekeurige selectie. (Eric Louis Haines/OpenAI via AP)

"De sleutel is het idee dat je zoveel vooruitgang kunt boeken in simulatie, "zei hij. "Dit is een plausibele weg voorwaarts, wanneer het doen van fysieke experimenten erg moeilijk is."

De echte vingers van Dactyl worden gevolgd door infraroodstippen en camera's. In opleiding, elke gesimuleerde beweging die de kubus dichter bij het doel bracht, leverde Dactyl een kleine beloning op. Door de kubus te laten vallen, voelde hij een 20 keer zo grote straf.

Het proces wordt versterkend leren genoemd. De robotsoftware herhaalt de pogingen miljoenen keren in een gesimuleerde omgeving, keer op keer proberen om de hoogste beloning te krijgen. OpenAI gebruikte ongeveer hetzelfde algoritme dat het gebruikte om menselijke spelers in een videogame te verslaan, "Dota 2."

In het echte leven, een team van onderzoekers heeft ongeveer een jaar gewerkt om de mechanische hand op dit punt te krijgen.

Waarom?

Op deze donderdag 26 juli 2018, foto, OpenAI-onderzoeker Jonas Schneider onderzoekt de robothand van het onderzoekslab in San Francisco. De hand, genaamd Dactyl, heeft een enkele baan, en dat is om een ​​kubus te draaien totdat de letter die naar boven wijst overeenkomt met een willekeurige selectie. (AP Foto/Ryan Nakashima)

Voor een, de hand in een gesimuleerde omgeving begrijpt geen wrijving. Dus ook al zijn zijn echte vingers rubberachtig, Dactyl mist menselijk begrip over de beste grepen.

Onderzoekers injecteerden hun gesimuleerde omgeving met veranderingen in de zwaartekracht, handhoek en andere variabelen, zodat de software leert te werken op een manier die aanpasbaar is. Dat hielp de kloof tussen real-world resultaten en gesimuleerde resultaten te verkleinen, die veel beter waren.

De variaties hielpen de hand erin te slagen de juiste letter meer dan een dozijn keer achter elkaar open te leggen voordat hij de kubus liet vallen. Bij simulatie, de hand slaagde meestal 50 keer achter elkaar voordat de test werd gestopt.

Het doel van OpenAI is het ontwikkelen van kunstmatige algemene intelligentie, of machines die denken en leren als mensen, op een manier die veilig is voor mensen en wijdverspreid is.

Musk heeft gewaarschuwd dat als AI-systemen alleen worden ontwikkeld door bedrijven met winstoogmerk of machtige regeringen, ze zouden op een dag de menselijke intelligentie kunnen overtreffen en gevaarlijker kunnen zijn dan een nucleaire oorlog met Noord-Korea.

© 2018 The Associated Press. Alle rechten voorbehouden.