science >> Wetenschap >  >> Elektronica

Onderzoeksteam ontwikkelt stemlokalisatietechnieken voor slimme luidsprekers

Een voorbeeld van hoe een Amazon Alexa de locatie van een persoon in een huis kan bepalen. Krediet:Romit Roy Chowdhury

Slimme luidsprekers - denk, een Amazon Alexa of een Google Home - bieden een breed scala aan mogelijkheden om zowel onze tijd als onze handen vrij te maken. We kunnen het ochtendnieuws horen terwijl we onze tanden poetsen, tijdens het uitkiezen van een jas om een ​​weerbericht vragen, en stel een timer in voor de oven terwijl je twee hete pannen tegelijk hanteert. Volgens Voicebot.ai, Alexa ondersteunt meer dan 100, 000 vaardigheden wereldwijd, maar een taak die het niet onder de knie heeft, is het bepalen van de gebruikerslocatie in huis.

Deze lokalisatietaak was de focus van het onlangs gepubliceerde artikel van een universiteit van Illinois in het onderzoeksteam van Urbana-Champaign, "Spraaklokalisatie met behulp van muurreflecties in de buurt." Het werk werd geaccepteerd voor de 26e jaarlijkse internationale conferentie over mobiel computergebruik en netwerken. In de krant, het team - onder leiding van Coordinated Science Lab-afgestudeerde student Sheng Shen - onderzoekt de ontwikkeling van VoLoc, een systeem dat de microfoonarray op Alexa gebruikt, evenals kamerecho's van de menselijke stem, om de locatie van de gebruiker in huis af te leiden.

Als u weet waar een gebruiker zich in een huis bevindt, kan een slim apparaat de momenteel beschikbare vaardigheden beter ondersteunen. Bijvoorbeeld, na het ontvangen van commando's zoals "zet het licht aan" of "verhoog de temperatuur, " Alexa moet momenteel raden welk licht en welke kamer het hart van de opdracht is. Met behulp van een techniek die bekend staat als omgekeerde triangulatie, Shen en adviseur Romit Roy Choudhury komen steeds dichter bij stemlokalisatie.

"Het toepassen van deze techniek op slimme speakers brengt nogal wat uitdagingen met zich mee, " deelde Shen, een student elektrotechniek en computertechniek (ECE). "Eerst, we moeten de directe menselijke stem en elk van de kamerecho's scheiden van de microfoonopname. Vervolgens, we moeten de richting voor elk van deze echo's nauwkeurig berekenen. Beide uitdagingen zijn moeilijk omdat de microfoons gewoon een mix van alle geluiden opnemen."

VoLoc pakt deze obstakels aan via een "align-and-cancel-algoritme" dat iteratief de richtingen van elk van de binnenkomende spraaksignalen isoleert, en van hen, reverse trianguleert de locatie van de gebruiker. Sommige aspecten van de geometrie van de kamer worden spontaan aangeleerd, wat dan helpt bij de triangulatie. Hoewel dit een belangrijke doorbraak is, Shen en Roy Choudhury zijn van plan het onderzoek binnenkort uit te breiden naar meer toepassingen.

"Onze onmiddellijke volgende stap is om te bouwen aan het referentiekader van de slimme luidspreker, " legde Shen uit. "Dit kan betekenen dat de locaties over elkaar heen worden gelegd, zoals geleverd door VoLoc, op een plattegrond om vast te stellen dat de gebruiker zich in de wasruimte bevindt. Alternatief, als de slimme luidspreker de geluiden van de wasmachine en droger op dezelfde locatie oppikt als de spraakopdracht, het kan tot dezelfde conclusie komen."

De mogelijkheden van deze functie zijn schijnbaar eindeloos en kunnen de huidige mogelijkheden van Alexa verbeteren.

"De implicaties zijn belangrijk, " zei Roy Choudhury, een CSL-professor en de W.J. "Jerry" Sanders III-Advanced Micro Devices, Inc. Scholar in elektrische en computertechniek. "Locatie kan Alexa helpen bij het verbeteren van spraakherkenning, omdat verschillende spraakvocabulaires en -modellen kunnen worden geladen. Bijvoorbeeld, een commando als 'dringend toevoegen aan het boodschappenlijstje' is misschien niet logisch, maar als Alexa weet dat de gebruiker in de wasruimte is, Alexa kan hieruit afleiden dat de gebruiker eigenlijk zei 'voeg wasmiddel toe aan het boodschappenlijstje'."

Shen en Roy Choudhury erkennen dat de technologie de privacy verder kan aantasten, door bedrijven als Amazon en Google beter in ons huis en dagelijks leven te laten kijken. Echter, ze geloven ook dat de voordelen van vitaal belang zijn, aangezien contextbewuste slimme apparaten cruciale ondersteunende technologieën kunnen worden voor senioren die zelfstandig wonen en meer.

Bijvoorbeeld, de technologie zou kunnen worden gebruikt om een ​​grootouder die zelfstandig woont eraan te herinneren hun medicatie in te nemen wanneer hij of zij langs het medicijnkastje komt, of om een ​​kind eraan te herinneren de kraan dicht te draaien als ze de badkamer uit rennen terwijl de kraan nog loopt.

"Het is meer dan het interpreteren van spraakopdrachten, "zei Shen. "Het zorgt ook voor een extra paar ogen als het gaat om de zorg voor dierbaren."