science >> Wetenschap >  >> Elektronica

Het gefluister van schizofrenie:machine learning vindt dat correcte woorden psychose voorspellen

Krediet:CC0 Publiek Domein

Een machinale leermethode ontdekte een verborgen aanwijzing in de taal van mensen die voorspellend was voor de latere opkomst van psychose - het frequente gebruik van woorden die verband houden met geluid. Een paper gepubliceerd door het tijdschrift npj Schizofrenie publiceerden de bevindingen van wetenschappers van Emory University en Harvard University.

De onderzoekers ontwikkelden ook een nieuwe machinale leermethode om de semantische rijkdom van de gesprekstaal van mensen nauwkeuriger te kwantificeren, een bekende indicator voor psychose.

Hun resultaten tonen aan dat geautomatiseerde analyse van de twee taalvariabelen - frequenter gebruik van woorden geassocieerd met geluid en spreken met een lage semantische dichtheid, of vaagheid - kan voorspellen of een risicopersoon later een psychose zal ontwikkelen met een nauwkeurigheid van 93 procent.

Zelfs getrainde clinici hadden niet gemerkt dat mensen met een risico op psychose meer woorden gebruiken die met geluid te maken hebben dan gemiddeld, hoewel abnormale auditieve waarneming een preklinisch symptoom is.

"Proberen deze subtiliteiten in gesprekken met mensen te horen, is als proberen microscopisch kleine ziektekiemen met je ogen te zien, " zegt Neguine Rezaii, eerste auteur van het artikel. "De geautomatiseerde techniek die we hebben ontwikkeld, is een heel gevoelig hulpmiddel om deze verborgen patronen te detecteren. Het is als een microscoop voor waarschuwingssignalen van psychose."

Rezaii begon aan het papier te werken terwijl ze een ingezetene was van de afdeling Psychiatrie en Gedragswetenschappen van de Emory School of Medicine. Ze is nu verbonden aan de afdeling Neurologie van de Harvard Medical School.

"Het was eerder bekend dat subtiele kenmerken van toekomstige psychose aanwezig zijn in de taal van mensen, maar we hebben machine learning gebruikt om verborgen details over die functies te ontdekken, " zegt senior auteur Phillip Wolff, een professor in de psychologie aan Emory. Wolff's lab richt zich op taalsemantiek en machine learning om besluitvorming en geestelijke gezondheid te voorspellen.

"Onze bevinding is nieuw en draagt ​​bij aan het bewijs dat het potentieel aantoont van het gebruik van machinaal leren om taalkundige afwijkingen te identificeren die verband houden met psychische aandoeningen, " zegt co-auteur Elaine Walker, een Emory hoogleraar psychologie en neurowetenschappen die onderzoekt hoe schizofrenie en andere psychotische stoornissen zich ontwikkelen.

Het begin van schizofrenie en andere psychotische stoornissen treedt meestal op in de vroege jaren '20, met waarschuwingssignalen - bekend als prodromaal syndroom - beginnend rond de leeftijd van 17. Ongeveer 25 tot 30 procent van de jongeren die voldoen aan de criteria voor een prodromaal syndroom zal schizofrenie of een andere psychotische stoornis ontwikkelen.

Met behulp van gestructureerde interviews en cognitieve tests, getrainde clinici kunnen psychose met ongeveer 80 procent nauwkeurigheid voorspellen bij mensen met een prodromaal syndroom. Onderzoek naar machine learning is een van de vele voortdurende inspanningen om diagnostische methoden te stroomlijnen, nieuwe variabelen identificeren, en de nauwkeurigheid van voorspellingen te verbeteren.

Momenteel, er is geen remedie voor psychose.

"Als we individuen die risico lopen eerder kunnen identificeren en preventieve interventies kunnen gebruiken, misschien kunnen we de tekorten terugdraaien, " zegt Walker. "Er zijn goede gegevens die aantonen dat behandelingen zoals cognitieve gedragstherapie het begin kunnen vertragen, en misschien zelfs het optreden van psychose verminderen."

Voor de huidige krant de onderzoekers gebruikten eerst machine learning om 'normen' voor conversatietaal vast te stellen. Ze voerden een computersoftwareprogramma de online gesprekken van 30, 000 gebruikers van Reddit, een social media platform waar mensen informeel discussiëren over uiteenlopende onderwerpen. Het softwareprogramma, bekend als Word2Vec, gebruikt een algoritme om individuele woorden in vectoren te veranderen, elk een locatie toewijzen in een semantische ruimte op basis van de betekenis ervan. Degenen met vergelijkbare betekenissen staan ​​dichter bij elkaar dan die met veel verschillende betekenissen.

Het Wolff-lab ontwikkelde ook een computerprogramma om uit te voeren wat de onderzoekers "vector unpacking, " of analyse van de semantische dichtheid van woordgebruik. Eerder werk heeft de semantische samenhang tussen zinnen gemeten. Door het uitpakken van de vector konden de onderzoekers kwantificeren hoeveel informatie in elke zin was verpakt.

Na het genereren van een basislijn van "normale" gegevens, de onderzoekers pasten dezelfde technieken toe op diagnostische interviews van 40 deelnemers die waren afgenomen door getrainde clinici, als onderdeel van de multi-site North American Prodrome Longitudinal Study (NAPLS), gefinancierd door de National Institutes of Health. NAPLS is gericht op jongeren met een klinisch hoog risico op psychose. Walker is de hoofdonderzoeker voor NAPLS bij Emory, een van de negen universiteiten die betrokken zijn bij het 14-jarige project.

De geautomatiseerde analyses van de deelnemersmonsters werden vervolgens vergeleken met het normale basislijnmonster en de longitudinale gegevens over de vraag of de deelnemers tot psychose waren overgegaan.

De resultaten toonden aan dat een hoger dan normaal gebruik van woorden gerelateerd aan geluid, gecombineerd met een hoger percentage van het gebruik van woorden met een vergelijkbare betekenis, betekende dat psychose waarschijnlijk aan de horizon was.

Sterke punten van het onderzoek zijn de eenvoud van het gebruik van slechts twee variabelen - die beide een sterke theoretische basis hebben - de replicatie van de resultaten in een holdout-dataset, en de hoge nauwkeurigheid van zijn voorspellingen, boven de 90 procent.

"In de klinische wereld, we missen vaak precisie, " zegt Rezaii. "We hebben meer gekwantificeerde, objectieve manieren om subtiele variabelen te meten, zoals die verborgen in het taalgebruik."

Rezaii en Wolff verzamelen nu grotere datasets en testen de toepassing van hun methoden op een verscheidenheid aan neuropsychiatrische ziekten, inclusief dementie.

"Dit onderzoek is niet alleen interessant vanwege het potentieel om meer te onthullen over geestesziekten, maar om te begrijpen hoe de geest werkt - hoe hij ideeën samenbrengt, Wolff zegt. "Machine learning-technologie ontwikkelt zich zo snel dat het ons tools geeft om de menselijke geest te dataminen."