Wetenschap
Drie stappen voor ons meta-learning algoritme. Krediet:Tianhe Yu en Chelsea Finn
Een team van onderzoekers van UC Berkeley heeft een manier gevonden om een robot een activiteit die hij op een videoscherm ziet, slechts één keer na te laten bootsen. In een krant die ze hebben geüpload naar de arXiv preprint-server, het team beschrijft de aanpak die ze hebben gebruikt en hoe het werkt.
Robots die leren dingen te doen door simpelweg een mens een handeling één keer te zien uitvoeren, zouden veel sneller veel meer nieuwe handelingen kunnen leren dan nu mogelijk is. Wetenschappers hebben hard gewerkt om erachter te komen hoe dit mogelijk te maken.
historisch echter, robots zijn geprogrammeerd om acties uit te voeren, zoals het oppakken van een object door via code die uitdrukkelijk aangeeft wat er moet gebeuren en hoe. Zo werken de meeste robots die dingen doen als auto's in elkaar zetten in een fabriek. Dergelijke robots moeten nog een trainingsproces ondergaan waarbij ze meerdere keren door procedures worden geleid totdat ze in staat zijn om ze zonder fouten uit te voeren. Recenter, robots zijn geprogrammeerd om puur door observatie te leren, net zoals mensen en andere dieren dat doen. Maar zo'n imitatief leren vereist meestal duizenden observaties. In deze nieuwe poging de onderzoekers beschrijven een door hen ontwikkelde techniek waarmee een robot een gewenste handeling kan uitvoeren door een mens dit slechts één keer te zien doen.
Om deze prestatie te volbrengen, de onderzoekers combineerden imitatieleren met een meta-leeralgoritme. Het resultaat is iets wat ze model-agnostische meta-learning (MAML) noemen. Meta-leren, leggen de onderzoekers uit, is een proces waarbij een robot leert door eerdere ervaringen op te nemen. Als een robot een video te zien krijgt van een mens die een peer of een ander soortgelijk object oppakt, bijvoorbeeld, en het in een kopje doen, kom of ander voorwerp, het kan een "gevoel" krijgen voor een doelstelling. Als in elk geval wordt geleerd om het gedrag op een bepaalde manier te imiteren, dan "leert" het wat te doen bij het observeren van ander soortgelijk gedrag. Dus, wanneer hij een video ziet van een persoon die een pruim oppakt en in een kom doet, hij herkent het gedrag en kan dat vertalen naar een soortgelijk eigen gedrag, die het vervolgens kan uitvoeren.
© 2018 Tech Xplore
Het is officieel - we zijn in de homestretch van de zomer. En hoewel het niet echt de tijd is om voor het nieuwe jaar te gaan studeren, is er geen reden waarom je de laatste paar weken
Wetenschap © https://nl.scienceaq.com