Wetenschap
Een robot moet leren over zijn lichaam en de omgeving. Het probeert een paar verschillende bewegingen en gebruikt het algoritme. Het kan dan voorspellen wat er zal gebeuren bij grotere bewegingen en bij hogere snelheden. Krediet:IST Oostenrijk/Birgit Rieger
Begrijpen hoe een robot zal reageren onder verschillende omstandigheden is essentieel om een veilige werking te garanderen. Maar hoe weet je wat een robot kapot maakt zonder hem daadwerkelijk te beschadigen? Een nieuwe methode ontwikkeld door wetenschappers van het Institute of Science and Technology Austria (IST Oostenrijk) en het Max Planck Institute for Intelligent Systems (MPI for Intelligent Systems) is de eerste machine learning-methode die observaties onder veilige omstandigheden kan gebruiken om nauwkeurige voorspellingen te doen voor alle mogelijke omstandigheden die door dezelfde fysieke dynamiek worden beheerst. Speciaal ontworpen voor levensechte situaties, hun methode biedt eenvoudige, interpreteerbare beschrijvingen van de onderliggende fysica. De onderzoekers presenteren hun bevindingen morgen op de prestigieuze International Conference for Machine Learning (ICML) van dit jaar.
Vroeger, machine learning was alleen in staat om gegevens te interpoleren - voorspellingen doen over situaties die "tussen" andere, bekende situaties. Het was niet in staat om te extrapoleren - voorspellingen te doen over situaties buiten het bekende - omdat het leert om de bekende gegevens zo lokaal mogelijk te matchen, ongeacht hoe het presteert buiten deze situaties. In aanvulling, het verzamelen van voldoende gegevens voor effectieve interpolatie is zowel tijd- als middelenintensief, en vereist gegevens uit extreme of gevaarlijke situaties. Maar nu, Georg Martius, voormalig ISTFELLOW en IST Oostenrijk postdoc, en sinds 2017 groepsleider bij MPI voor Intelligent Systems in Tübingen, Subham S. Sahoo, een doctoraat student ook bij MPI voor Intelligent Systems, en Christoph Lampert, professor aan IST Oostenrijk, een nieuwe machine learning-methode ontwikkeld die deze problemen aanpakt, en is de eerste machine learning-methode die nauwkeurig extrapoleert naar ongeziene situaties.
Het belangrijkste kenmerk van de nieuwe methode is dat het ernaar streeft de ware dynamiek van de situatie te onthullen:het neemt gegevens op en retourneert de vergelijkingen die de onderliggende fysica beschrijven. "Als je die vergelijkingen kent, " zegt Georg Martius, "dan kun je zeggen wat er in alle situaties zal gebeuren, zelfs als je ze niet hebt gezien." Met andere woorden, hierdoor kan de methode betrouwbaar worden geëxtrapoleerd, waardoor het uniek is onder de machine learning-methoden.
De werkwijze van het team onderscheidt zich ook op een aantal andere manieren. Eerst, de uiteindelijke benaderingen die eerder tijdens machine learning werden geproduceerd, waren veel te complex voor een mens om te begrijpen of om mee te werken. Bij de nieuwe methode de resulterende vergelijkingen zijn veel eenvoudiger:"De vergelijkingen van onze methode zijn iets dat je in een leerboek zou zien - eenvoudig en intuïtief, ", zegt Christoph Lampert. Dit laatste is een ander belangrijk verschil:andere methoden voor machinaal leren geven geen inzicht in de relatie tussen omstandigheden en resultaten - en dus geen intuïtie of het model zelfs maar plausibel is. "In elk ander onderzoeksgebied, we verwachten modellen die fysiek logisch zijn, die ons vertellen waarom, ", voegt Lampert toe. "Dit is wat we mogen verwachten van machine learning, en wat onze methode biedt." Tot slot, om de interpreteerbaarheid te garanderen en te optimaliseren voor fysieke situaties, het team baseerde hun leermethode op een ander type raamwerk. Dit nieuwe ontwerp is eenvoudiger dan eerdere methoden, wat in de praktijk betekent dat er minder gegevens nodig zijn om dezelfde of zelfs betere resultaten te geven.
En het is niet allemaal theorie:"In mijn groep, we zijn eigenlijk bezig met het ontwikkelen van een robot die dit soort leren gebruikt. In de toekomst, de robot zou experimenteren met verschillende bewegingen, vervolgens machine learning kunnen gebruiken om de vergelijkingen te ontdekken die het lichaam en de beweging bepalen, waardoor het gevaarlijke acties of situaties kan vermijden, ", voegt Martius toe. Hoewel robots een actief onderzoeksgebied zijn, de methode kan worden gebruikt met elk type gegevens, van biologische systemen tot röntgentransitie-energieën, en kan ook worden opgenomen in grotere machine learning-netwerken.
Wetenschap © https://nl.scienceaq.com