science >> Wetenschap >  >> Elektronica

Analyse van gesproken taal en 3D-gezichtsuitdrukkingen om de ernst van depressie te meten

Multimodale gegevens. Voor elk klinisch interview, de onderzoekers gebruiken:(a) video van 3D gezichtsscans, (b) audio-opname, gevisualiseerd als een log-mel-spectrogram, en (c) teksttranscriptie van de spraak van de patiënt. Het model voorspelt de ernst van depressieve symptomen met behulp van alle drie de modaliteiten. Krediet:Haque et al.

Onderzoekers van Stanford hebben onlangs het gebruik van machine learning onderzocht om de ernst van depressieve symptomen te meten door de gesproken taal en 3D-gezichtsuitdrukkingen van mensen te analyseren. Hun multi-model methode, geschetst in een paper dat vooraf is gepubliceerd op arXiv, zeer veelbelovende resultaten behaald, met een gevoeligheid van 83,3 procent en een specificiteit van 82,6 procent.

Momenteel, meer dan 300 miljoen mensen wereldwijd lijden in verschillende mate aan depressiestoornissen. In extreme gevallen, depressie kan leiden tot zelfmoord, met een gemiddelde van ongeveer 800, 000 mensen die elk jaar zelfmoord plegen.

Psychische stoornissen worden momenteel gediagnosticeerd na zorgvuldig onderzoek door een breed scala aan zorgverleners, inclusief huisartsen, klinisch psychologen en psychiaters. Niettemin, het opsporen van psychische aandoeningen is vaak veel uitdagender dan het diagnosticeren van lichamelijke ziekten.

Meerdere factoren, inclusief sociaal stigma, behandelingskosten en beschikbaarheid, kan voorkomen dat getroffen personen hulp zoeken. Momenteel, onderzoekers schatten dat 60 procent van de mensen met psychische aandoeningen geen behandeling krijgt.

Het ontwikkelen van methoden die automatisch depressieve symptomen kunnen detecteren, zou de nauwkeurigheid en beschikbaarheid van diagnostische hulpmiddelen kunnen verbeteren, wat leidt tot snellere en efficiëntere interventies. Een team van onderzoekers van Stanford heeft onlangs het gebruik van machine learning onderzocht om de ernst van depressieve symptomen te meten.

"In dit werk, we presenteren een machine learning-methode voor het meten van de ernst van depressieve symptomen, " schreven de onderzoekers in hun paper. "Onze multimodale methode maakt gebruik van 3D gezichtsuitdrukkingen en gesproken taal, algemeen verkrijgbaar vanaf moderne mobiele telefoons."

Een multimodale zinsinbedding leren. Algemeen, het model is een causaal CNN. De input voor het model is:audio, 3D gezichtsscans, en tekst. De multimodale zinsinbedding wordt toegevoerd aan een depressieclassificator en PHQ-regressiemodel (hierboven niet weergegeven). Krediet:Haque et al.

Depressieve personen vertonen vaak een reeks verbale en non-verbale symptomen, inclusief monotone toonhoogte, verminderde articulatiesnelheid, lagere spreekvolumes, minder gebaren, en meer neerwaartse blikken. Een van de meest gebruikelijke tests om de ernst van depressiesymptomen te beoordelen, is de vragenlijst voor de gezondheid van de patiënt (PHQ).

De door de onderzoekers bedachte methode analyseert audiotracks van de stem van patiënten, 3D-video van hun gezichtsuitdrukkingen, en teksttranscripties van hun klinische interviews. Op basis van deze gegevens, het model produceert ofwel een PHQ-score of classificatielabel dat wijst op een depressieve stoornis.

Bij een eerste evaluatie het model behaalde een gemiddelde fout van 3,67 punten (15,3 procent relatief), op de PHQ-schaal, opsporen van depressieve stoornis met 83,3 procent sensitiviteit en 82,6 procent specificiteit. De onderzoekers kozen ervoor om de gegevens die in hun onderzoek werden gebruikt te verzamelen via mens-naar-computer-interviews, in plaats van van mens tot mens.

"Vergeleken met een menselijke interviewer, onderzoek heeft aangetoond dat patiënten minder angst voor onthulling rapporteren en meer emotionele intensiteit vertonen wanneer ze met een avatar praten, " schreven de onderzoekers. "Bovendien, mensen ervaren psychologische voordelen van het onthullen van emotionele ervaringen aan chatbots."

In de toekomst, deze nieuwe machinale leermethode zou wereldwijd in smartphones kunnen worden ingezet, het ondersteunen van de missie om de geestelijke gezondheidszorg goedkoper en toegankelijker te maken. Volgens de onderzoekers is hun model is ontworpen om bestaande klinische methoden aan te vullen en aan te vullen, in plaats van formele diagnoses te stellen.

"We presenteerden een multimodale machine learning-methode die technieken uit spraakherkenning, computer visie, en natuurlijke taalverwerking, " schreven de onderzoekers. "We hopen dat dit werk anderen zal inspireren om op AI gebaseerde hulpmiddelen te bouwen voor het begrijpen van psychische stoornissen die verder gaan dan depressie."

© 2018 Wetenschap X Netwerk