science >> Wetenschap >  >> Elektronica

Neurale netwerk leert spraakpatronen die depressie voorspellen in klinische interviews

MIT-onderzoekers hebben een neuraal netwerkmodel ontwikkeld dat onbewerkte tekst en audiogegevens van interviews kan analyseren om spraakpatronen te ontdekken die wijzen op depressie. Deze methode zou kunnen worden gebruikt om diagnostische hulpmiddelen te ontwikkelen voor clinici die tekenen van depressie kunnen detecteren in natuurlijke gesprekken. Krediet:Massachusetts Institute of Technology

Om depressie te diagnosticeren, clinici interviewen patiënten, specifieke vragen stellen - over, zeggen, vroegere psychische aandoeningen, levensstijl, en stemming - en identificeer de aandoening op basis van de reacties van de patiënt.

In recente jaren, machine learning is verdedigd als een nuttig hulpmiddel voor diagnostiek. Machine learning-modellen, bijvoorbeeld, zijn ontwikkeld die woorden en intonaties van spraak kunnen detecteren die op depressie kunnen duiden. Maar deze modellen hebben de neiging om te voorspellen of een persoon depressief is of niet, gebaseerd op de specifieke antwoorden van de persoon op specifieke vragen. Deze methoden zijn nauwkeurig, maar hun afhankelijkheid van het type vraag dat wordt gesteld, beperkt hoe en waar ze kunnen worden gebruikt.

In een paper die wordt gepresenteerd op de Interspeech-conferentie, MIT-onderzoekers beschrijven een neuraal netwerkmodel dat kan worden losgelaten op onbewerkte tekst en audiogegevens van interviews om spraakpatronen te ontdekken die wijzen op depressie. Gegeven een nieuw onderwerp, het kan nauwkeurig voorspellen of het individu depressief is, zonder enige andere informatie over de vragen en antwoorden nodig te hebben.

De onderzoekers hopen dat deze methode kan worden gebruikt om hulpmiddelen te ontwikkelen om tekenen van depressie in natuurlijke gesprekken te detecteren. In de toekomst, het model zou kunnen bijvoorbeeld, krachtige mobiele apps die de tekst en stem van een gebruiker controleren op mentale nood en waarschuwingen verzenden. Dit kan vooral handig zijn voor mensen die geen arts kunnen bereiken voor een eerste diagnose, vanwege de afstand, kosten, of een gebrek aan bewustzijn dat er iets mis kan zijn.

"De eerste hints die we hebben dat een persoon gelukkig is, opgewonden, verdrietig, of een ernstige cognitieve aandoening heeft, zoals depressie, is door hun spraak, " zegt eerste auteur Tuka Alhanai, een onderzoeker in het Computer Science and Artificial Intelligence Laboratory (CSAIL). "Als je [depressie-detectie]-modellen op een schaalbare manier wilt implementeren... je wilt de hoeveelheid beperkingen die je hebt op de gegevens die je gebruikt minimaliseren. Je wilt het in een regulier gesprek implementeren en het model laten oppakken, van de natuurlijke interactie, de toestand van het individu."

De technologie kan nog steeds natuurlijk, worden gebruikt voor het identificeren van mentale problemen in informele gesprekken in klinische kantoren, voegt co-auteur James Glass toe, een senior onderzoeker bij CSAIL. "Elke patiënt zal anders praten, en als het model veranderingen ziet, is het misschien een teken voor de artsen, " zegt hij. "Dit is een stap voorwaarts om te zien of we iets kunnen doen om clinici te helpen."

De andere co-auteur van het papier is Mohammad Ghassemi, een lid van het Instituut voor Medische Technologie en Wetenschap (IMES).

Contextvrije modellering

De belangrijkste innovatie van het model ligt in het vermogen om patronen te detecteren die wijzen op depressie, en dan die patronen toewijzen aan nieuwe individuen, zonder aanvullende informatie. "We noemen het 'contextvrij, ' omdat u geen beperkingen oplegt aan het soort vragen dat u zoekt en het soort antwoorden op die vragen, ' zegt Alhanai.

Andere modellen zijn voorzien van een specifieke set vragen, en vervolgens voorbeelden gegeven van hoe een persoon zonder depressie reageert en voorbeelden van hoe een persoon met een depressie reageert, bijvoorbeeld, het eenvoudige onderzoek, "Heeft u een voorgeschiedenis van depressie?" Het gebruikt die exacte antwoorden om vervolgens te bepalen of een nieuw persoon depressief is wanneer exact dezelfde vraag wordt gesteld. "Maar zo werken natuurlijke gesprekken niet, ' zegt Alhanai.

De onderzoekers, anderzijds, gebruikte een techniek genaamd sequentiemodellering, vaak gebruikt voor spraakverwerking. Met deze techniek, ze voedden de modelreeksen van tekst en audiogegevens van vragen en antwoorden, van zowel depressieve als niet-depressieve personen, een voor een. Naarmate de reeksen zich opstapelden, het model extraheerde spraakpatronen die naar voren kwamen voor mensen met of zonder depressie. Woorden zoals, zeggen, "verdrietig, " "laag, " of "naar beneden, " kan gepaard gaan met audiosignalen die vlakker en eentoniger zijn. Personen met een depressie kunnen ook langzamer spreken en langere pauzes tussen woorden gebruiken. Deze tekst- en audio-identificaties voor mentale problemen zijn in eerder onderzoek onderzocht. Het was uiteindelijk aan het model om te bepalen of patronen voorspellend waren voor depressie of niet.

"Het model ziet opeenvolgingen van woorden of spreekstijl, en stelt vast dat deze patronen vaker voorkomen bij mensen die al dan niet depressief zijn, " zegt Alhanai. "Dan, als het dezelfde reeksen ziet in nieuwe onderwerpen, het kan voorspellen of ze ook depressief zijn."

Deze sequencing-techniek helpt het model ook om naar het gesprek als geheel te kijken en verschillen op te merken tussen hoe mensen met en zonder depressie in de loop van de tijd praten.

Depressie detecteren

De onderzoekers trainden en testten hun model op een dataset van 142 interacties uit het Distress Analysis Interview Corpus dat audio, tekst, en video-interviews van patiënten met psychische problemen en virtuele agenten gecontroleerd door mensen. Elk onderwerp wordt beoordeeld in termen van depressie op een schaal van 0 tot 27, met behulp van de Persoonlijke Gezondheidsvragenlijst. Scores boven een grens tussen matig (10 tot 14) en matig ernstig (15 tot 19) worden als depressief beschouwd, terwijl alle anderen onder die drempel als niet depressief worden beschouwd. Van alle onderwerpen in de dataset, 28 (20 procent) wordt als depressief bestempeld.

Bij experimenten, het model werd geëvalueerd met behulp van metrieken van precisie en recall. Precisie meet welke van de depressieve proefpersonen die door het model werden geïdentificeerd als depressief werden gediagnosticeerd. Recall measures the accuracy of the model in detecting all subjects who were diagnosed as depressed in the entire dataset. In precision, the model scored 71 percent and, on recall, scored 83 percent. The averaged combined score for those metrics, considering any errors, was 77 percent. In the majority of tests, the researchers' model outperformed nearly all other models.

One key insight from the research, Alhanai notes, is that, during experiments, the model needed much more data to predict depression from audio than text. With text, the model can accurately detect depression using an average of seven question-answer sequences. With audio, the model needed around 30 sequences. "That implies that the patterns in words people use that are predictive of depression happen in shorter time span in text than in audio, " Alhanai says. Such insights could help the MIT researchers, and others, further refine their models.

This work represents a "very encouraging" pilot, Glass says. But now the researchers seek to discover what specific patterns the model identifies across scores of raw data. "Right now it's a bit of a black box, " Glass says. "These systems, echter, are more believable when you have an explanation of what they're picking up. … The next challenge is finding out what data it's seized upon."

The researchers also aim to test these methods on additional data from many more subjects with other cognitive conditions, such as dementia. "It's not so much detecting depression, but it's a similar concept of evaluating, from an everyday signal in speech, if someone has cognitive impairment or not, " Alhanai says.

This story is republished courtesy of MIT News (web.mit.edu/newsoffice/), a popular site that covers news about MIT research, innovation and teaching.