Wetenschap
MIT-onderzoekers hebben een machine learning-model ontwikkeld dat patiënten in subpopulaties groepeert op basis van gezondheidsstatus om het risico van overlijden van een patiënt tijdens hun verblijf op de IC beter te voorspellen. Deze techniek presteert beter dan 'globale' mortaliteitsvoorspellingsmodellen en onthult prestatieverschillen van die modellen over specifieke subpopulaties van patiënten. Krediet:Massachusetts Institute of Technology
Op de intensive care-afdelingen, waar patiënten binnenkomen met een breed scala aan gezondheidsproblemen, triage is sterk afhankelijk van klinisch oordeel. IC-personeel voert tal van fysiologische tests uit, zoals bloedonderzoek en het controleren van vitale functies, om te bepalen of patiënten een onmiddellijk risico lopen om te overlijden als ze niet agressief worden behandeld.
Vul in:machine learning. De afgelopen jaren zijn er tal van modellen ontwikkeld om de patiëntsterfte op de IC te helpen voorspellen, op basis van verschillende gezondheidsfactoren tijdens hun verblijf. Deze modellen, echter, prestatie nadelen hebben. Een veelvoorkomend type "globaal" model wordt getraind op een enkele grote patiëntenpopulatie. Deze kunnen gemiddeld goed werken, maar slecht op sommige subpopulaties van patiënten. Anderzijds, een ander type model analyseert verschillende subpopulaties, bijvoorbeeld die gegroepeerd op vergelijkbare voorwaarden, leeftijd van de patiënt, of ziekenhuisafdelingen, maar hebben vaak beperkte gegevens voor training en testen.
In een paper onlangs gepresenteerd op de Proceedings of Knowledge Discovery and Data Mining-conferentie, MIT-onderzoekers beschrijven een machine-learningmodel dat functioneert als het beste van twee werelden:het traint specifiek op subpopulaties van patiënten, maar deelt ook gegevens over alle subpopulaties om betere voorspellingen te krijgen. Daarbij, het model kan het sterfterisico van een patiënt tijdens de eerste twee dagen op de IC beter voorspellen, vergeleken met strikt globale en andere modellen.
Het model verwerkt eerst fysiologische gegevens in elektronische medische dossiers van eerder opgenomen IC-patiënten, sommigen die tijdens hun verblijf waren overleden. Daarbij, het leert hoge voorspellers van sterfte, zoals een lage hartslag, hoge bloeddruk, en verschillende laboratoriumtestresultaten - hoge glucosespiegels en aantal witte bloedcellen, onder andere - gedurende de eerste paar dagen en verdeelt de patiënten in subpopulaties op basis van hun gezondheidsstatus. Gegeven een nieuwe patiënt, het model kan kijken naar de fysiologische gegevens van die patiënt van de eerste 24 uur en, met behulp van wat het is geleerd door het analyseren van die subpopulaties van patiënten, de kans dat de nieuwe patiënt ook zal overlijden in de volgende 48 uur beter inschatten.
Bovendien, de onderzoekers ontdekten dat het evalueren (testen en valideren) van het model door specifieke subpopulaties ook de prestatieverschillen van globale modellen benadrukt bij het voorspellen van mortaliteit bij subpopulaties van patiënten. Dit is belangrijke informatie voor het ontwikkelen van modellen die nauwkeuriger kunnen werken met specifieke patiënten.
"IC's hebben een zeer hoge bandbreedte, met veel patiënten " zegt eerste auteur Harini Suresh, een afgestudeerde student in het Computer Science and Artificial Intelligence Laboratory (CSAIL). "Het is belangrijk om ruim van tevoren uit te zoeken welke patiënten daadwerkelijk risico lopen en meer onmiddellijke aandacht nodig hebben."
Co-auteurs van het papier zijn CSAIL-afgestudeerde student Jen Gong, en John Guttag, de Dugald C. Jackson hoogleraar elektrotechniek.
Multitasking en subpopulaties van patiënten
Een belangrijke innovatie van het werk is dat, tijdens de training, het model verdeelt patiënten in verschillende subpopulaties, die aspecten van de algemene gezondheidstoestand en sterfterisico's van een patiënt vastlegt. Het doet dit door een combinatie van fysiologische gegevens te berekenen, per uur afgebroken. Fysiologische gegevens omvatten, bijvoorbeeld, glucosespiegels, potassium, en stikstof, evenals hartslag, bloed pH, zuurstofverzadiging, en ademfrequentie. Verhogingen van de bloeddruk en kaliumspiegels - een teken van hartfalen - kunnen wijzen op gezondheidsproblemen in vergelijking met andere subpopulaties.
Volgende, het model maakt gebruik van een multitasking-methode om voorspellende modellen te leren bouwen. Wanneer de patiënten worden opgedeeld in subpopulaties, aan elke subpopulatie worden verschillend afgestemde modellen toegewezen. Elk variantmodel kan dan nauwkeuriger voorspellingen doen voor zijn gepersonaliseerde patiëntengroep. Met deze benadering kan het model ook gegevens delen over alle subpopulaties wanneer het voorspellingen doet. Wanneer een nieuwe patiënt wordt gegeven, het zal de fysiologische gegevens van de patiënt matchen met alle subpopulaties, vind de beste pasvorm, en van daaruit het sterfterisico beter inschatten.
"We gebruiken alle patiëntgegevens en delen informatie tussen populaties waar het relevant is, "zegt Suresh. "Op deze manier, we kunnen … geen last hebben van problemen met gegevensschaarste, rekening houdend met de verschillen tussen de verschillende subpopulaties van patiënten."
"Patiënten die op de IC worden opgenomen, verschillen vaak in waarom ze daar zijn en hoe hun gezondheidstoestand is. Hierdoor, ze zullen heel anders worden behandeld, " Gong voegt eraan toe. Hulpmiddelen voor klinische besluitvorming "moeten rekening houden met de heterogeniteit van deze patiëntenpopulaties ... en ervoor zorgen dat er voldoende gegevens zijn voor nauwkeurige voorspellingen."
Een belangrijk inzicht van deze methode, Gong zegt, kwam van het gebruik van een multitasking-aanpak om ook de prestaties van een model op specifieke subpopulaties te evalueren. Globale modellen worden vaak beoordeeld op algemene prestaties, over hele patiëntenpopulaties. Maar de experimenten van de onderzoekers toonden aan dat deze modellen eigenlijk ondermaats presteren op subpopulaties. Het globale model dat in het artikel werd getest, voorspelde de sterfte over het algemeen vrij nauwkeurig, maar daalde een aantal procentpunten in nauwkeurigheid bij het testen op individuele subpopulaties.
Dergelijke prestatieverschillen zijn moeilijk te meten zonder te evalueren door subpopulaties, Gong zegt:"We willen evalueren hoe goed ons model het doet, niet alleen op een heel cohort van patiënten, maar ook als we het opsplitsen voor elk cohort met verschillende medische kenmerken. Dat kan onderzoekers helpen bij het beter trainen en evalueren van voorspellende modellen."
Resultaten behalen
De onderzoekers testten hun model met gegevens uit de MIMIC Critical Care Database, die tientallen gegevens bevat over heterogene patiëntenpopulaties. Van ongeveer 32, 000 patiënten in de dataset, meer dan 2, 200 stierven in het ziekenhuis. Ze gebruikten 80 procent van de dataset om te trainen, en 20 procent om het model te testen.
Bij het gebruik van gegevens van de eerste 24 uur, het model clusterde de patiënten in subpopulaties met belangrijke klinische verschillen. Twee subpopulaties, bijvoorbeeld, bevatte patiënten met verhoogde bloeddruk gedurende de eerste paar uur, maar één nam na verloop van tijd af, terwijl de ander de hele dag op de hoogte bleef. Deze subpopulatie had het hoogste sterftecijfer.
Met behulp van die subpopulaties, het model voorspelde de mortaliteit van de patiënten gedurende de volgende 48 uur met een hoge specificiteit en sensitiviteit, en diverse andere maatstaven. Het multitasking-model presteerde aanzienlijk beter dan een wereldwijd model met enkele procentpunten.
Volgende, de onderzoekers willen meer data uit elektronische patiëntendossiers gebruiken, zoals behandelingen die de patiënten krijgen. Ze hopen ook, in de toekomst, om het model te trainen om trefwoorden te extraheren uit gedigitaliseerde klinische aantekeningen en andere informatie.
Dit verhaal is opnieuw gepubliceerd met dank aan MIT News (web.mit.edu/newsoffice/), een populaire site met nieuws over MIT-onderzoek, innovatie en onderwijs.
Wetenschap © https://nl.scienceaq.com