Wetenschap
Onderzoekers voeren experiment uit op mobiele robot. Krediet:HU Yanming
Mensen laten een verbazingwekkend aanpassingsvermogen zien bij het omgaan met complexe taken in het dagelijks leven. Dit aanpassingsvermogen is de directe belichaming van het individuele leervermogen, die mensen in staat stelt om hun eigen gedragsvermogen zelfstandig en stapsgewijs te verbeteren.
Daarom, als robots dit vermogen kunnen hebben, ze kunnen automatisch nieuwe gedragspatronen genereren op basis van de realtime acquisitie van gegevens en gevallen. Dit vermogen toont duidelijke intelligentie, wat gedragsintelligentie wordt genoemd.
Onlangs, de onderzoeker aan het Shenyang Institute of automation van de Chinese Academy of Sciences ontwikkelde een nieuwe methode een nieuwe methode ontwikkeld om de gedragsintelligentie van robots te verbeteren, gerelateerde resultaten zijn gepubliceerd op IEEE-transacties op cognitieve en ontwikkelingssystemen .
De onderzoeker stelde een nieuw raamwerk voor incrementele leermethode voor op basis van Q-Learning en het adaptieve kernel-lineaire (AKL) -model. Het raamwerk stelt de robot in staat om nieuw gedrag te leren zonder de vorige te vergeten. Volgens de nieuwe methode robotgedrag kan worden geëvalueerd door middel van autonoom leren en imitatieleren, en de modelstructuur en parameters kunnen in realtime worden gewijzigd met behulp van een nieuw L2-norm kernel recursief kleinste kwadraten (L2-KRLS) algoritme.
Daarnaast, ze voerden twee experimenten uit om de prestaties van de nieuwe methode te valideren. De resultaten toonden aan dat het voorgestelde raamwerk stapsgewijs gedrag kan leren in verschillende omgevingen. Lokaal - hebzuchtig, op beleid gebaseerd Q-learning is sneller dan bestaande Q-learning-algoritmen. Momenteel, deze prestatie is toegepast in autonome robotnavigatie.
Wetenschap © https://nl.scienceaq.com