science >> Wetenschap >  >> Elektronica

Nieuwe technologie verbetert spraakperceptie

Toekomstige gebruikers van hoortoestellen zullen hun luisteren nauwkeuriger kunnen afstemmen dankzij nieuwe Deense technologie. Een onderzoeker van de Universiteit van Aalborg gebruikt machine learning om een ​​computerprogramma te leren hoe ongewenste ruis kan worden verwijderd en spraak kan worden verbeterd.

Een van de grootste uitdagingen voor mensen met gehoorverlies is het verstaan ​​van spraak in een rumoerige omgeving. Het probleem wordt het cocktailparty-effect genoemd, omdat situaties waarin veel mensen tegelijkertijd praten, het vaak erg moeilijk maken om te onderscheiden wat er wordt gezegd door de persoon met wie u praat.

Hoewel de meeste moderne hoortoestellen verschillende vormen van spraakverbeteringstechnologie bevatten, ingenieurs worstelen nog steeds met het ontwikkelen van een systeem dat een significante verbetering oplevert.

doctoraat student Mathew Kavalekalam van het Audio Lab Analysis aan de Universiteit van Aalborg gebruikt machine learning om een ​​algoritme te ontwikkelen waarmee een computer gesproken woorden en achtergrondgeluid kan onderscheiden. Het project wordt uitgevoerd in samenwerking met gehoorapparaatonderzoekers van GN Advanced Science en wordt ondersteund door Innovation Fund Denmark.

Computer luistert en leert

"Het hoorcentrum in onze hersenen voert meestal een reeks enorm gecompliceerde berekeningen uit waardoor we ons op één stem kunnen concentreren - zelfs als er veel andere mensen op de achtergrond praten, " legt Mathew Kavalekalam uit, Universiteit van Aalborg. "Maar dat vermogen is heel moeilijk te recreëren in een machine."

Mathew Kavalekalam begon met een digitaal model dat beschrijft hoe spraak wordt geproduceerd in een menselijk lichaam, uit de longen via keel en strottenhoofd, mond- en neusholten, tanden, lippen, enzovoort.

Hij gebruikte het model om het type signaal te beschrijven waarnaar een computer moet 'luisteren' bij het identificeren van een pratende stem. Vervolgens zei hij tegen de computer dat hij moest gaan luisteren en leren.

Lawaai is niet alleen lawaai

"Achtergrondgeluid verschilt afhankelijk van de omgeving, van straat- of verkeerslawaai als u buiten bent tot het lawaai van pratende mensen in een pub of cafetaria, Mathew Kavalekalam zegt. "Dat is een van de vele redenen waarom het zo lastig is om een ​​model voor spraakverbetering te bouwen dat de spraak die je wilt horen filtert op het gebrabbel waarin je niet geïnteresseerd bent."

Op de universiteit van Aalborg speelde Mathew Kavalekalam verschillende opnames af van stemmen die tegen de computer spraken en voegde geleidelijk verschillende soorten achtergrondgeluid toe op een toenemend niveau.

Door deze machine learning toe te passen, de computersoftware ontwikkelde een manier om de geluidspatronen te herkennen en te berekenen hoe het specifieke geluid van pratende stemmen kon worden verbeterd en niet het achtergrondgeluid.

Vijftien procent verbetering

Het resultaat van het werk van Kavalekalam is een stukje software dat mensen met gehoorverlies effectief kan helpen om spraak beter te verstaan. Het is in staat om gesproken woorden te identificeren en te verbeteren, zelfs in een zeer lawaaierige omgeving.

Tot nu toe is het model getest op tien mensen die spraak en achtergrondgeluid hebben vergeleken met en zonder het gebruik van het algoritme van Kavalekalam.

De proefpersonen werden gevraagd om eenvoudige taken uit te voeren met kleur, cijfers en letters die aan hen werden beschreven in lawaaierige omgevingen.

De resultaten geven aan dat Kavalekalam mogelijk een veelbelovende oplossing heeft ontwikkeld. De spraakverstaanbaarheid van proefpersonen verbeterde met vijftien procent in zeer rumoerige omgevingen.

Pittige signaalverwerking

Echter, er is nog wat werk aan de winkel voordat de software van Mathew Kavalekalam zijn weg vindt naar nieuwe hoortoestellen. De technologie moet worden aangepast en afgestemd voordat deze praktisch toepasbaar is.

Het algoritme moet worden geoptimaliseerd om minder rekenkracht in beslag te nemen. Hoewel de technologie steeds sneller en krachtiger wordt, er zijn hardwarebeperkingen in kleine, moderne hoortoestellen.

"Als het gaat om spraakverbetering, signaalverwerking moet echt pittig zijn. Als het geluid vertraagd is in het hoortoestel, het loopt niet synchroon met de mondbewegingen en dat zal je uiteindelijk nog meer in de war brengen, " legt Mathew Kavalekalam uit.