science >> Wetenschap >  >> Elektronica

Onderzoekers stellen een techniek voor oppervlakte-elektromyografie met hoge dichtheid voor voor automatische spraakherkenning

Verdeling van de sEMG-elektroden met hoge dichtheid aan de linker- en rechterkant van het gezicht/de hals:(links) Vier hoofddelen van het gezicht; (rechts) Symmetrische opstelling. Krediet:CHEN Shixiong

Verbale communicatie is een belangrijke manier om deel te nemen aan sociale interacties. Het normale spreekproces vereist gecoördineerde samentrekkingen van een massa gewrichtsspieren op het gezicht en de nek.

Oppervlakte-elektromyografie (sEMG)-signalen die elektrofysiologische informatie bevatten die verband houdt met spreekactiviteiten, worden meestal beschouwd als een alternatieve invoer voor automatische spraakherkenning.

Een onderzoeksteam onder leiding van prof. Chen Shixiong van de Shenzhen Institutes of Advanced Technology (SIAT) van de Chinese Academie van Wetenschappen stelde een high-density (HD) sEMG-techniek voor met behulp van dichte arrays van individuele elektroden om spieractiviteiten over een relatief groot gebied te verwerven met een rijke set aan informatie voor adequate bewegingsclassificatie.

In het op sEMG gebaseerde spraakherkenningssysteem de locaties van elektroden die worden gebruikt voor het opnemen van de sEMG-signalen zijn de belangrijkste factor die de classificatieprestaties bij automatische spraakherkenning zou beïnvloeden. Echter, in eerdere onderzoeken, de plaatsing van de elektroden was afhankelijk van de kennis van de individuele onderzoekers zonder voorafgaande kwantitatieve analyse of benchmarkstandaard.

Chen's team analyseerde de bijdrage van sEMG-signalen tussen de linker- en rechterkant van de gezichts- en nekspieren bij het classificeren van de dagelijkse woorden in spreektaak met Engels en Chinees, respectievelijk.

In hun studie hebben de HD sEMG-signalen werden opgenomen door de oppervlakte-elektroden die 120 kanalen hebben van de gezichts- en nekspieren van acht proefpersonen.

Opname van de elektrode-arrays in de linker- en rechterkant van de gezichts- en nekspieren, classificatienauwkeurigheden werden verkregen bij het herkennen van de spreektaken, vergeleken met de signalen opgenomen door HD sEMG.

De resultaten toonden aan dat er vergelijkbare classificatienauwkeurigheden werden verkregen tussen het gebruik van de HD sEMG-opname vanaf de linker- en rechterkant van de nek. Integendeel, er bleek een significant verschil in classificatienauwkeurigheden tussen het gebruik van de signalen van de linker en rechter gezichtsspieren.

"De HD sEMG-signalen van symmetrische posities in de nek zijn consistent in hun bijdrage aan spraakherkenning, terwijl gezichtssignalen dat niet zijn, " zei prof. Chen.

"De voorgestelde HD sEMG-techniek kan de juiste plaatsing van elektroden bepalen die worden gebruikt voor automatische spraakherkenning, wat een potentieel hulpmiddel kan zijn om het aantal elektroden te verminderen en de optimale locatie van kanalen voor spraakherkenning te selecteren."