science >> Wetenschap >  >> Elektronica

Waarom mensen lange tijd machines zullen verslaan bij het herkennen van spraak

Krediet:Pathdoc/Shutterstock.cim

Stel je een wereld voor waarin Siri je altijd begrijpt, Google Translate werkt perfect, en de twee creëren iets dat lijkt op een vertaalcircuit in Doctor Who-stijl. Stelt u zich eens voor dat u vrijuit kunt communiceren waar u ook gaat (niet dat u op school Frans hoeft te mompelen tegen uw Parijse ober). Het is een aantrekkelijk, maar nog ver vooruitzicht. Een van de knelpunten om deze realiteit vooruit te helpen, is variatie in taal, vooral gesproken taal. Technologie kan het niet helemaal aan.

mensen, anderzijds, zijn verbazingwekkend goed in het omgaan met variaties in taal. We zijn zo goed, in feite, dat we er echt rekening mee houden als er wel eens iets kapot gaat. Toen ik Nieuw-Zeeland bezocht, Ik dacht een tijdje dat mensen me "huisdier, "een Newcastle-achtige uiting van genegenheid. Ze waren, in feite, gewoon mijn naam zeggen, Pat. Mijn aha-moment vond plaats in een coffeeshop ("Flat white for pet!" gaf me een pauze).

Dit verhaal illustreert hoe verschillende accenten van het Engels enigszins verschillende klinkers hebben - een bekend feit. Maar laten we proberen te begrijpen wat er gebeurde toen ik de Kiwi-uitspraak van Pat as . verkeerd hoorde huisdier . Er is een bepaalde reeks klanken die we associëren met klinkers, Leuk vinden een of e . Deze bereiken zijn niet absoluut. Liever, hun grenzen variëren, bijvoorbeeld tussen verschillende accenten. Als luisteraars zich hier niet aan aanpassen, zoals ik in dit geval deed, de toewijzing van geluid aan betekenis kan worden vervormd.

Men zou kunnen, moeizaam, verschillende accenten aanleren aan een spraakherkenningssysteem, maar accentvariatie is slechts het topje van de ijsberg. Klinkergeluiden kunnen ook variëren, afhankelijk van onze leeftijd, geslacht, maatschappelijke klasse, etniciteit, seksuele geaardheid, mate van intoxicatie, hoe snel praten we, met wie we praten, of we nu wel of niet in een lawaaierige omgeving zijn … de lijst gaat maar door, en verder.

De crux/boeven van de zaak

Bedenk dat een recent onderzoek waar ik bij betrokken was, aantoonde dat zelfs verhuizen (of niet) iemands klinkers kan beïnvloeden. specifiek, er is een verband tussen hoe sprekers van Noord-Engels de klinker uitspreken in woorden als crux , en hoe vaak ze de afgelopen tien jaar zijn verhuisd. Mensen die helemaal niet zijn bewogen, spreken vaker uit crux hetzelfde als oplichters , wat de traditionele Noord-Engelse uitspraak is. Maar degenen die vier keer of meer zijn verhuisd, hebben meer kans om verschillende klinkers in de twee woorden te hebben, ook in het zuiden van Engeland.

Er is, natuurlijk, niets over de bewegingshandeling die dit veroorzaakt. Maar meerdere keren verhuizen hangt samen met andere leefstijlfactoren, bijvoorbeeld interactie met meer mensen, inclusief mensen met verschillende accenten, die van invloed kunnen zijn op de manier waarop we spreken.

Andere bronnen van variatie kunnen te maken hebben met taalkundige factoren, zoals woordstructuur. Een treffend voorbeeld komt van woordparen zoals heerser , wat betekent "meetinstrument" en heerser , wat 'leider' betekent.

Deze twee woorden zijn oppervlakkig identiek, maar ze verschillen op een dieper structureel niveau. EEN heerser is iemand die regeert, net als een zanger is iemand die zingt, zodat we deze woorden kunnen analyseren als bestaande uit twee betekenisvolle eenheden. In tegenstelling tot, heerser wat betekent "meetinstrument" kan niet verder worden ontleed.

Mate van overlap tussen 'boeven' en 'crux' klinkercategorieën, afhankelijk van het aantal verhuizingen in het afgelopen decennium. Gegevens van 143 sprekers uit het noorden van Engeland.

Het blijkt dat de twee betekenissen van heerser worden geassocieerd met een andere klinker voor veel sprekers van Zuid-Brits Engels, en het verschil tussen de twee woorden is de afgelopen jaren groter geworden:het is groter voor jongere sprekers dan voor oudere sprekers. Dus zowel de verborgen taalstructuur als de leeftijd van de spreker kunnen invloed hebben op de manier waarop we bepaalde klinkers uitspreken.

Einde nooit in zicht

Dit illustreert een andere belangrijke eigenschap van taalvariatie:het verandert voortdurend. Taalonderzoekers moeten daarom voortdurend hun begrip van variatie herzien, waarvoor op zijn beurt nieuwe gegevens moeten worden verworven, en het bijwerken van de analyse. De manier waarop we dit in de taalkunde doen, wordt radicaal veranderd door nieuwe technologieën, vooruitgang in instrumentele data-analyse, en de alomtegenwoordigheid van opnameapparatuur (in 2018, 82% van de Britse volwassen bevolking had een opnameapparaat, ook wel een smartphone genoemd).

Moderne taalkundige projecten kunnen op verschillende manieren profiteren van de technologische vooruitgang. Bijvoorbeeld, de English Dialects App verzamelt opnames op afstand via smartphones, om een ​​groot en constant bijgewerkt corpus van moderne Engelse accenten op te bouwen. Dat corpus is de bron van de bevinding met betrekking tot de klinker in crux in Noord-Engels, bijvoorbeeld. Door informatie van dit en vele andere projecten te verzamelen, kunnen we variaties volgen met een grotere dekking, en om steeds nauwkeurigere modellen te bouwen die de realisatie van individuele geluiden voorspellen.

Kan dit nieuw verfijnde linguïstische begrip ook de spraakherkenningstechnologie verbeteren? Misschien, maar om te verbeteren, de technologie moet veel meer over u weten.

Dit artikel is opnieuw gepubliceerd vanuit The Conversation onder een Creative Commons-licentie. Lees het originele artikel.