science >> Wetenschap >  >> Elektronica

Patent talk:Relax, niemand wordt gestoord door je spraakopdrachten in de openbare ruimte

Krediet:PCT/CN2017/087767

Stille spraakopdrachten? Microsoft is ermee bezig, heel erg bedankt. Ze hebben een patent aangevraagd voor "Silent Voice Input". Microsoft is, in dit octrooi, kijken naar een module die de spraakopdrachten van een gebruiker kan detecteren die door niemand in de buurt van de gebruiker kunnen worden gedetecteerd.

Siri en Cortana zijn steeds sterker geworden, maar als Windows Centraal merkte op, "Geen enkel bedrijf lijkt te hebben overwogen hoe ongemakkelijk het kan zijn om in het openbaar bevelen te geven."

fluisterend, we zetten uitgaande spraak in, daarin ademen we uit. Bij dit idee een spraakinvoer wordt in het geheel niet opgemerkt door de omgeving. Vergeleken met conventionele spraakoplossingen op basis van normale spraak of fluisteren, de stille spraakinvoermethode omvat het gebruik van "ingressieve stem" tijdens het inademingsproces van de gebruiker.

Denk er over na. Het gebruik van hardop-spraakcommando's in een openbare ruimte heeft de neiging om de gebruiker zelfbewust te maken. Er is een technisch probleem en er is een "mentaal" probleem, zei Masaaki Fukumoto, tijdens een presentatie in oktober in Berlijn.

Men kan zich er zelf van bewust zijn dat er privé-informatie wordt gelekt; men kan zich er zelf van bewust zijn mensen in de onmiddellijke nabijheid die vreemden zijn, te irriteren; en men kan zich ervan bewust zijn dat men wordt aangezien voor het praten met niemand anders in de buurt.

"Hallo, iedereen, dit is een stille stem." In een video van een presentatie, dat waren woorden op een scherm. Maar je kon niet dezelfde woorden uit zijn mond horen komen. Applaus. "Dus, " hij ging verder, "Dit is agressieve spraak."

Een module kan "stille" spraakopdrachten detecteren - stil staat tussen aanhalingstekens. OKE, het is niet het soort gefluister waar je vriend tegenaan glijdt in de bioscoop en er staat niet "Psst!"

Mallory Locklear Engadget :"In plaats van een typisch gefluister, waarbij je adem uit je mond beweegt, met stille spraakinvoer, je hoort in te ademen terwijl je fluistert. Het wordt ingressive airflow genoemd en Microsoft zegt dat het zal voorkomen dat de gefluisterde stemmen van gebruikers worden vervormd. En dat is een probleem, want om deze methode te laten werken, je moet je mond heel dicht bij de microfoon houden. We praten een tot twee millimeter dichtbij."

Dit idee heeft alles te maken met een "apparaat" dat dicht bij de mond wordt geplaatst.

Dit is hoe het patent het bespreekt:

"Door het apparaat zeer dicht bij de mond van de gebruiker te plaatsen met een ultrakleine opening tussen de microfoon en het apparaat, de voorgestelde stille spraakinvoeroplossing kan een zeer kleine stemlekkage realiseren, en daardoor de gebruiker in staat te stellen ultralage spraakinvoer te gebruiken in openbare en mobiele situaties, zonder de omringende mensen te storen."

Met andere woorden, vanaf Jez Corden in Windows Centraal , "de 'stille' invoermethode kan gefluister detecteren en spraakopdrachten extrapoleren uit de luchtstroom die wordt gecreëerd tijdens het uitspreken van woorden."

De module, zei Corden, kan behoren tot verschillende apparaten zoals slimme horloges, telefoons, headsetmicrofoons en afstandsbediening van de tv.

Stel je voor dat je een ring aan je mond houdt - in ieder geval zouden andere mensen op het eerste gezicht aannemen dat je een ring aan je mond houdt; je vertelt het om de e-mail te controleren.

We zullen, dit is precies het voorbeeld dat Cal Jeffrey's punt ondersteunt TechSpot :Stelt het patent iets voor dat minder belastend zou zijn voor de zelfbewuste poging tot spraakopdrachten?

Jeffrey schreef, "Het is de vraag of iemand zich meer of minder op zijn gemak zou voelen door zijn horloge recht voor zijn mond te houden in plaats van alleen een hoorbaar verbaal commando te geven. Als alternatief, het kan handig zijn op momenten dat normale stemniveaus niet helemaal geschikt zijn, zoals wanneer anderen slapen."

Bovendien, octrooiaanvragen kunnen al dan niet echte "spraakinvoer" -oplossingen worden.

Octrooiontwikkelingen zijn niet het enige probleem; er is nog een punt over deze octrooiaanvraag. Laurent Giret bij OpMSFT merkte op dat het niet duidelijk was of de "stille stem"-benadering zoals beschreven in het patent "de manier waarop we omgaan met digitale assistenten echt zou kunnen veranderen".

Hij zei dat de meeste gebruikers zich waarschijnlijk gewoon in het openbaar zullen blijven gedragen en dingen op de ouderwetse manier zullen blijven doen. En vanaf vandaag, het is nog steeds vaak sneller om aanraakinvoer te gebruiken dan spraakopdrachten die niet altijd goed worden begrepen."

Fundamenteel, het goede nieuws is in ieder geval dat computerwetenschappers zich ervan bewust zijn dat de kans lonkt om met een oplossing te komen die de zelfbewuste mensen helpt zich beter te voelen bij het geven van spraakopdrachten in het openbaar.

© 2019 Wetenschap X Netwerk