Wetenschap
Wat zijn de kenmerken van de manier waarop je zegt, "Hallo, " (of iets anders trouwens) waardoor je herkenbaar bent aan de telefoon? Ondanks de toenemende hoeveelheid literatuur over persoonlijke spraakkwaliteit, er is eigenlijk heel weinig bekend over hoe het geluid van een individuele luidspreker kan worden gekarakteriseerd.
Twee onderzoekers van UCLA in Los Angeles, Californië, Patricia Keating en Jody Kreiman, bundelen hun krachten (zoals ze in het verleden vaak hebben gedaan) om akoestische instrumenten toe te passen op hun taalkundig onderzoek, deze vraag onderzoeken. Keating en Kreiman zullen voorlopige bevindingen van hun onderzoek presenteren op de 172e bijeenkomst van de Acoustical Society of America en de 5e gezamenlijke bijeenkomst met de Acoustical Society of Japan, gehouden 28 november - dec. 2, 2016, in Honolulu, Hawaii.
Eigenlijk, Keating en Kreimen willen weten hoe je kunt meten hoe mensen klinken. "Er is geen manier om te kwantificeren wat dat betekent, "Zei Kreiman. "Als je iets fysieks verandert, kun je voorspellen hoe dat zal klinken?"
De stem van een persoon kan in de loop van de tijd variëren vanwege zijn emotionele toestand, Gezondheid, de context van het gesprek, of tal van andere factoren die het kwantificeren van deze meting bijzonder moeilijk maken.
Een grote hoeveelheid bewijs uit de fonetiek, cognitieve psychologie en neuropsychologie geven aan dat luisteraars al deze variabiliteit binnen de spreker organiseren in een prototype voor elke spreker - een 'gemiddelde' representatie - en een reeks afwijkingen van dat prototype. Zelfs een enkele lettergreep kan genoeg informatie bevatten om de ene stem van de andere te onderscheiden, maar het is nog niet duidelijk wat specifiek de belangrijkste identificerende kenmerken zijn binnen zo'n prototype, of hoeveel elk kenmerk moet variëren voordat de stem onherkenbaar wordt.
"Stemkwaliteit gaat dwalen, "Zei Keating. "We kijken naar het punt waarop je niet meer als jezelf klinkt en als iemand anders gaat klinken."
Keating en Kreiman analyseerden digitaal opnames van vijftig vrouwen, alle moedertaalsprekers van het Engels, die vijf zinnen twee keer op drie verschillende dagen lazen. Bij deze analyse werd gekeken naar meerdere akoestische parameters voor de klinkers en medeklinkers die deel uitmaken van de gelezen zinnen, zoals de grondfrequentie, intensiteiten van harmonische frequenties ten opzichte van elkaar, en hoe ze zich verhouden tot de onderliggende geluidsniveaus in de stem.
Deze zinnen voorzagen elk kenmerk van een kwantitatief gemiddelde en bereik, waarvan de verzameling een potentieel identificerend stemprofiel vormde. Door alle sprekers te vergelijken met deze set kenmerken - het stemprofiel van een bepaalde persoon - met behulp van een willekeurige set van hun voorbeeldzinnen, het kan worden getest op nauwkeurigheid bij het onderscheiden van de juiste spreker en vergeleken met hoe goed andere reeksen kenmerken werken om een bepaalde stem te onderscheiden.
Dit werk bouwt voort op eerder werk dat de twee met succes hebben voltooid met een steekproef van slechts drie sprekers. De grotere steekproefomvang biedt meer inzicht om te begrijpen welke kenmerken, en met welke marge, een herkenbare stem onherkenbaar maken. Dit is de reden waarom de set samples uit vergelijkbare luidsprekers bestond, alle vrouwelijke en moedertaalsprekers van het Engels.
"Wie moet er verward zijn en onder welke omstandigheden?" vroeg Kreeman. "Hoeveel van een akoestische verandering is waarneembaar?" Vooruit kijken, het beantwoorden van deze vragen kan helpen bij het genereren van voorspellingen over verwarring in de context van zowel menselijke luisteraars, die de neiging hebben om binnen enkele seconden herkenbaar te onderscheiden, en computeralgoritmen, waarvoor doorgaans monsters van minder dan een minuut nodig zijn.
Wetenschap © https://nl.scienceaq.com