science >> Wetenschap >  >> Elektronica

Googles robot leert lopen in de echte wereld

Krediet:arXiv:2002.08550 [cs.RO]

Het gebied van robotica deed een stap vooruit - gevolgd door een andere, en nog een paar - toen een robot genaamd Rainbow Dash zichzelf onlangs leerde lopen. De machine met vier poten had maar een paar uur nodig om achteruit en vooruit te leren lopen, en draai daarbij rechts en links.

Onderzoekers van Google, UC Berkeley en het Georgia Institute of Technology publiceerden een paper over de ArXiv preprint-server waarin ze een statistische AI-techniek beschrijven die bekend staat als deep wapeningsleren die ze gebruikten om deze prestatie te produceren, wat om verschillende redenen belangrijk is.

De meeste implementaties van versterkingsleren vinden plaats in computergesimuleerde omgevingen. regenboog streepje, echter, gebruikte deze technologie om te leren lopen in een echte fysieke omgeving.

Bovendien, het was in staat om dit te doen zonder een specifiek leermechanisme, zoals menselijke instructeurs of gelabelde trainingsgegevens. Eindelijk, Rainbow Dash slaagde erin op meerdere oppervlakken te lopen, inclusief een zacht schuimmatras en een deurmat met vrij opvallende uitsparingen.

De diepe leertechnieken die de robot gebruikte, omvatten een soort machine learning waarbij een agent interageert met een omgeving om met vallen en opstaan ​​te leren. De meeste use-cases voor versterkingsleren hebben betrekking op geautomatiseerde games waarin digitale agenten leren spelen om te winnen.

Deze vorm van machinaal leren verschilt aanzienlijk van traditioneel leren onder toezicht of zonder toezicht, waarin machine learning-modellen gelabelde trainingsgegevens nodig hebben om te leren. Diep versterkend leren combineert benaderingen van versterkend leren met diep leren, waarin de schaal van traditionele machine learning enorm wordt uitgebreid met enorme rekenkracht.

Hoewel het onderzoeksteam Rainbow Dash heeft gecrediteerd voor het zelf leren lopen, menselijk ingrijpen speelde nog steeds een substantiële rol bij het bereiken van dat doel. Onderzoekers moesten grenzen creëren waarbinnen de robot leerde lopen om te voorkomen dat hij het gebied verlaat.

Ze moesten ook specifieke algoritmen bedenken om te voorkomen dat de robot naar beneden zou vallen, waarvan sommige gericht waren op het beperken van de beweging van de robot. Om ongevallen zoals valschade te voorkomen, Het leren van robotica-versterking vindt meestal plaats in een digitale omgeving voordat algoritmen worden overgedragen aan een fysieke robot om zijn veiligheid te behouden.

De triomf van Rainbow Dash vindt plaats ongeveer een jaar nadat onderzoekers er in eerste instantie achter kwamen hoe ze robots konden laten leren in fysieke, in tegenstelling tot virtuele, omgeving.

Chelsea Finn, een Stanford-assistent-professor verbonden aan Google die niet heeft deelgenomen aan het onderzoek, zegt, "De persoon uit het [leer]proces halen is heel moeilijk. Door robots meer autonoom te laten leren, robots zijn dichter bij het kunnen leren in de echte wereld waarin we leven."

© 2020 Wetenschap X Netwerk