science >> Wetenschap >  >> Elektronica

Reinforcement learning versnelt het afstemmen van robotprotheses

Krediet:North Carolina State University

Onderzoekers van de North Carolina State University, de University of North Carolina en de Arizona State University hebben een intelligent systeem ontwikkeld voor het "tunen" van elektrische knieprothesen, waardoor patiënten binnen enkele minuten comfortabel kunnen lopen met de prothese, in plaats van de uren die nodig zijn als het apparaat is afgesteld door een getrainde klinische beoefenaar. Het systeem is het eerste dat uitsluitend vertrouwt op versterkingsleren om de robotprothese af te stemmen.

Wanneer een patiënt een robotknieprothese krijgt, het apparaat moet worden afgestemd op die specifieke patiënt. Het nieuwe afstemsysteem past 12 verschillende controleparameters aan, het aanpakken van prothesedynamiek, zoals gewrichtsstijfheid, gedurende de gehele loopcyclus.

Normaal gesproken, een menselijke beoefenaar werkt samen met de patiënt om een ​​handvol parameters te wijzigen. Dit kan uren duren. Het nieuwe systeem is gebaseerd op een computerprogramma dat gebruikmaakt van versterkingsleren om alle 12 parameters te wijzigen. Hiermee kunnen patiënten een elektrische knieprothese gebruiken om in ongeveer 10 minuten op een vlakke ondergrond te lopen.

"We beginnen door een patiënt een aangedreven knieprothese te geven met een willekeurig geselecteerde set parameters, " zegt Helen Huang, co-auteur van een paper over het werk en een professor in de Joint Department of Biomedical Engineering bij NC State en UNC. "Dan laten we de patiënt beginnen te lopen, onder gecontroleerde omstandigheden.

"Gegevens over het apparaat en het lopen van de patiënt worden verzameld via een reeks sensoren in het apparaat, Huang zegt. "Een computermodel past parameters op het apparaat aan en vergelijkt het looppatroon van de patiënt in realtime met het profiel van een normaal looppatroon. Het model kan vertellen welke parameterinstellingen de prestaties verbeteren en welke instellingen de prestaties verminderen. Met behulp van versterkend leren, het rekenmodel kan snel de set parameters identificeren waarmee de patiënt normaal kan lopen. bestaande benaderingen, vertrouwen op getrainde clinici, kan een halve dag duren."

Terwijl het werk momenteel in een gecontroleerde, klinische setting, een doel zou zijn om een ​​draadloze versie van het systeem te ontwikkelen, waardoor gebruikers de parameters van de aangedreven prothese kunnen blijven verfijnen bij gebruik in echte omgevingen.

"Dit werk is gedaan voor scenario's waarin een patiënt op een vlakke ondergrond loopt, maar in principe we zouden ook versterkingsleercontrollers kunnen ontwikkelen voor situaties zoals het op- of aflopen van trappen, " zegt Jennie Si, co-auteur van het artikel en een professor in elektrische, computer- en energietechniek bij ASU.

"Ik heb gewerkt aan versterkend leren vanuit het perspectief van dynamische systeembesturing, die rekening houdt met sensorruis, interferentie van de omgeving, en de eis van systeemveiligheid en stabiliteit, Si zegt. "Ik herkende de ongekende uitdaging om te leren beheersen, live, een prothese die tegelijkertijd wordt beïnvloed door de menselijke gebruiker. Dit is een co-adaptatieprobleem waarvoor geen direct beschikbare oplossing bestaat uit klassieke regelontwerpen of de huidige, state-of-the-art versterking leren gecontroleerde robots. We zijn verheugd om te ontdekken dat ons algoritme voor het leren van versterking daadwerkelijk heeft geleerd om de prothese te laten werken als onderdeel van een menselijk lichaam in zo'n opwindende toepassingsomgeving."

Huang zegt dat onderzoekers hopen het proces nog efficiënter te maken. "Bijvoorbeeld, we denken dat we het proces kunnen verbeteren door combinaties van parameters te identificeren die meer of minder kans van slagen hebben, en het model trainen om zich eerst te concentreren op de meest veelbelovende parameterinstellingen."

De onderzoekers merken op dat, hoewel dit werk veelbelovend is, veel vragen moeten worden beantwoord voordat het beschikbaar is voor wijdverbreid gebruik.

"Bijvoorbeeld, het doel van het afstemmen van de prothese in deze studie is om te voldoen aan de normatieve kniebeweging bij het lopen, Huang zegt. "We hebben geen rekening gehouden met andere loopprestaties (zoals loopsymmetrie) of de voorkeur van de gebruiker. Voor een ander voorbeeld, onze afstemmingsmethode kan worden gebruikt om het apparaat buiten de klinieken en laboratoria af te stemmen om het systeem in de loop van de tijd aan te passen aan de behoefte van de gebruiker. Echter, we moeten de veiligheid bij gebruik in de echte wereld waarborgen, aangezien bedieningsfouten kunnen leiden tot struikelen en vallen. Aanvullende tests zijn nodig om de veiligheid aan te tonen."

De onderzoekers merken ook op dat, als het systeem effectief blijkt te zijn en wijdverbreid in gebruik wordt genomen, het zou waarschijnlijk de kosten voor patiënten verlagen door de noodzaak voor patiënten om klinische bezoeken te brengen om met beoefenaars te werken, te beperken.

De krant, "Online Reinforcement Learning Control voor het personaliseren van een robotknieprothese, " is gepubliceerd in het tijdschrift IEEE-transacties op cybernetica .