Wetenschap
Krediet:openai
een geletterd, veelkleurig blok:een triviale taak wacht op mensen om het op te pakken, draai het om, gooi het rond in de palm van onze handen. Voor een robotexpert Hoewel, dit is een bergopwaartse taak die moeilijk te beklimmen is. Handmanipulatie voor robots is altijd een uitdaging geweest.
Voer Dactyl in. Een OpenAI-video die maandag is gepost, getiteld Leervaardigheid, toonden trots hun robotsysteem, Dactylus, die is gemaakt om objecten te manipuleren - op een eersteklas manier.
Het accent ligt op het woord behendigheid. Zijn vingers hanteren het blok op een opmerkelijke manier, inclusief het behendig draaien van het blok op zijn verschillende kanten. Het leerde hoe het blok in elke gewenste richting kon worden gedraaid.
Ze trainden een convolutioneel neuraal netwerk, zei IEEE-spectrum 's Evan Ackerman, een schaduwhand besturen om objecten te manipuleren, in slechts 50 uur.
Om zeker te zijn, de andere reden waarom hun hand belangstelling trok, was dat deze in een kortere tijd werd opgewerkt. Ackerman onderstreepte het belang van tijdsbesparingen voor robotteams. (De cijfers zijn nederig. IEEE-spectrum noemde 50 succesvolle kubusmanipulaties als resultaat van 6, 144 CPU-cores en 8 GPU's verzamelen 100 jaar gesimuleerde robotervaring in 50 uur.)
Het kost mensen jaren om "robuuste" niveaus van handmanipulaties te bereiken. We zullen, robotten, zei Ackerman, "heb die tijd niet. Leren door oefening en ervaring is nog steeds de beste keuze voor complexe taken als deze, en de uitdaging is om een manier te vinden om sneller en efficiënter te leren dan alleen een robothand iets te geven om steeds opnieuw te manipuleren totdat het leert wat werkt en wat niet, die waarschijnlijk ongeveer honderd jaar zou duren."
Reuters beschreef op dezelfde manier waarom hun werk ertoe doet:"Fysieke training duurt maanden of jaren en heeft zijn eigen problemen - bijvoorbeeld, als een robothand een werkstuk laat vallen, een mens moet het oppakken en terugleggen. Dat is ook duur. Onderzoekers hebben geprobeerd die jaren van fysieke training in stukken te hakken en ze naar meerdere computers te distribueren voor een softwaresimulatie die de training in uren of dagen kan doen, zonder menselijke hulp."
Een ander opwindend aspect werd door Stephen Nellis in het Reuters-artikel genoemd. "Onderzoekers injecteerden willekeurige ruis in de softwaresimulatie, waardoor de virtuele wereld van de robothand zo rommelig is dat deze niet in de war raakt door het onverwachte in de echte wereld."
Door de lat voor handmanipulatie hoger te leggen, het team was erin geslaagd om variabiliteiten te dekken die niet goed kunnen worden gemodelleerd. Ackerman schreef, "Dit omvat de massa en afmetingen van het object, wrijving van zowel het oppervlak van het object als de vingertoppen van de robot, hoe goed de gewrichten van de robot gedempt zijn, actuator krachten, gezamenlijke limieten, motor speling en lawaai, en meer."
In hun OpenAI-blogposting, het team zei dat ze een mensachtige robothand hebben getraind om fysieke objecten "met ongekende behendigheid" te manipuleren. Ze merkten op hoe Dactyl volledig in simulatie werd getraind, "aanpassen aan de natuurkunde in de echte wereld met behulp van technieken waaraan we het afgelopen jaar hebben gewerkt. Dactyl leert helemaal opnieuw met behulp van hetzelfde algemene leeralgoritme en dezelfde code als OpenAI Five."
Het is mogelijk om agenten te trainen in simulatie en ze real-world taken te laten oplossen, ze zeiden, zonder fysiek nauwkeurige modellering van de wereld.
© 2018 Tech Xplore
Wetenschap © https://nl.scienceaq.com