science >> Wetenschap >  >> Elektronica

End-to-end leren van het genereren van co-spraakgebaren voor humanoïde robots

Het voorgestelde model genereert een reeks houdingen van het bovenlichaam en is getraind op menselijke gebaren uit TED-talks. Krediet:Yoon et al.

Onderzoekers van het Electronics and Telecommunications Research Institute (ETRI) in Zuid-Korea hebben onlangs een neuraal netwerkmodel ontwikkeld dat reeksen van co-spraakgebaren kan genereren. hun voorbeeld, getraind op 52 uur TED-talks, produceerde met succes mensachtige gebaren die overeenkwamen met spraakinhoud.

"Slimme apparaten waarmee we communiceren, zijn geëvolueerd van pc's naar mobiele telefoons en slimme luidsprekers, "Youngwoo Yoon, een van de onderzoekers die het onderzoek heeft uitgevoerd, vertelde TechXplore. "We denken dat sociale robots het volgende interactieplatform kunnen zijn. Fysieke beweging is een van de belangrijkste verschillen tussen sociale robots en andere slimme apparaten, nieuwe mogelijkheden openen voor het nabootsen van menselijk of dierlijk gedrag, wat de intimiteit kan vergroten."

Co-spraakgebaren kunnen de kwaliteit van interacties tussen mensen en sociale robots aanzienlijk verbeteren. De meeste bestaande robots produceren gebaren met behulp van op regels gebaseerde spraak-gebaar-associatiemethoden. Echter, deze technieken vergen aanzienlijke inspanningen, omdat ze gebaseerd zijn op menselijke expertise en kennis.

"We wilden natuurlijk en mensachtig sociaal gedrag genereren, vooral handgebaren tijdens het spreken, "Zei Yoon. "Anderen observeren is een heel natuurlijke manier om nieuw gedrag aan te leren, dus stelden we een op leren gebaseerd model voor het genereren van gebaren voor dat was getraind op een dataset van TED-talks."

Het model van Yoon en zijn collega's is getraind op een dataset met 52 uur aan videobeelden van TED-talks. Na het trainen, het model zou sequenties van mensachtige gebaren en bovenlichaamhoudingen kunnen genereren die overeenkomen met geschreven spraaktekst.

"Het ontwerpen van het sociale gedrag van robots is moeilijk en tijdrovend omdat we rekening moeten houden met contexten, natuurlijkheid, de esthetiek van beweging, de controleruimte van robots, en een aantal andere factoren, Yoon legde uit. "Recente end-to-end leerstudies hebben licht geworpen op het potentieel van kunstmatige intelligentie om dergelijk complex gedrag te genereren. Na het zien van succesvolle toepassingen in autonoom rijden en het genereren van gezichtsbewegingen, we hebben besloten om end-to-end leren toe te passen op het genereren van gebaren in co-spraak."

Het door Yoon en zijn collega's ontwikkelde neurale netwerkmodel genereerde met succes verschillende soorten gebaren, inclusief iconisch, metaforisch, deiktisch, en sla gebaren. Bovendien, het was in staat om continue reeksen gebaren te genereren voor spraakteksten van elke lengte.

De onderzoekers ontdekten dat hun methode beter presteerde dan de basismethoden bij het maken van gebaren die op die van mensen lijken. Bij een subjectieve beoordeling 46 mensen die op Amazon Mechanical Turk waren gerekruteerd, waren van mening dat de gebaren die het genereerde menselijk waren en nauw overeenkwamen met de spraakinhoud.

"We ontdekten dat robots sociale vaardigheden kunnen leren, " zei Yoon. "Voor de generatie van co-spraakgebaren, het op de grootschalige dataset getrainde model is algemeen genoeg, zodat de robot menselijke gebaren kan maken voor elke spraak. We denken dat deze benadering kan worden toegepast op andere sociale vaardigheden, evenals voor personages in videogames en VR-werelden."

De studie uitgevoerd door Yoon en zijn collega's benadrukte het potentieel van end-to-end leren voor het genereren van co-spraakgebaren. In de toekomst, het zou kunnen worden gebruikt om de interacties tussen mens en robot te verbeteren en zou ook een inspiratie kunnen zijn voor soortgelijk onderzoek, aangezien de TED talks-dataset die ze gebruikten openbaar beschikbaar is. De onderzoekers zijn nu van plan om met hun studie een stap verder te gaan, door gepersonaliseerde gebaren voor verschillende robots te genereren.

"Robots kunnen hun eigen persoonlijkheid hebben, zoals mensen, Yoon zei. "Een gepersonaliseerde methode voor het genereren van gebaren zou ervoor kunnen zorgen dat verschillende robots zich uiten met verschillende gebarenstijlen, volgens hun persoonlijkheid."

© 2018 Wetenschap X Netwerk