Wetenschap
Krediet:CC0 Publiek Domein
Chronische aandoeningen zoals hartaandoeningen en diabetes nemen al tientallen jaren toe. Ze zijn tegenwoordig de belangrijkste doodsoorzaak en invaliditeit in de VS en een reden waarom de kosten van de gezondheidszorg uit de hand lopen.
Dus het is heel logisch om mensen te identificeren die risico lopen op chronische aandoeningen voordat ze ziek worden. Op z'n minst, vroeg ingrijpen kan vaak het tempo van de ziekte vertragen en de kwaliteit van leven van patiënten verbeteren - en daarbij mogelijk miljarden dollars aan medische kosten besparen.
Dat is de reden waarom veel werkgevers - zo'n 50%, volgens een RAND-rapport - sponsor gestimuleerde welzijnsprogramma's voor hun werknemers. Naast sportschoolkortingen, deze programma's omvatten doorgaans een beoordeling van de gezondheidsrisico's in de vorm van laboratoriumtests die worden gebruikt om de risicofactoren van elke persoon voor veel voorkomende ziekten te berekenen. Risicogroepen krijgen dan extra preventieve zorg en toezicht.
Helaas, de verwachte voordelen komen niet altijd uit, zegt Mohsen Bayati, een universitair hoofddocent operaties, informatie, en technologie aan de Stanford Graduate School of Business. Verschillende onderzoeken hebben aangetoond dat dergelijke programma's uiteindelijk meer geld kunnen kosten dan ze besparen. Een waarschijnlijke reden, hij zegt, is dat de risicobeoordelingen zelf niet zo nauwkeurig zijn.
"Als je iemand ten onrechte als risicovol identificeert - een zogenaamd 'false positive' - betaal je voor onnodige diensten, ' zegt Bayati. 'En als je iemand mist die echt risico loopt - een vals negatief - dan krijg je in de toekomst nog steeds te maken met die enorme medische rekeningen.'
Een oplossing, hij zegt, zou zijn om een uitgebreider panel van tests uit te voeren. Maar dat zou ook de kosten verhogen. "Laboratoriumtesten zijn duur. Bedrijven doen dit voor veel werknemers, dus kijken ze naar een vrij kleine set standaard biomarkers. En dan is het detectievermogen niet erg sterk."
In plaats daarvan, Bayati zegt, de sleutel tot het laten werken van deze preventieve programma's is het verbeteren van de selectie van biomarkers. Maar hoe doe je dat? Om het strenger te zeggen:hoe kies je een minimale set markers die de diagnostische kracht voor een reeks ziekten zal maximaliseren?
Dat is de puzzel die Bayati in een recent artikel heeft aangepakt, waarvan hij samen met twee Stanford-collega's schreef:Sonia Bhaskar, doctoraat, een voormalige onderzoeksassistent van Stanford die nu werkt als datawetenschapper bij Netflix, en Andrea Montanari, hoogleraar statistiek en elektrotechniek. Met behulp van technische jiu-jitsu uit het veld van machine learning, ze ontwikkelden een methode die kan worden gebruikt voor elke groep doelziekten of programmabudget.
Toen ze het testten op medische dossiers voor zo'n 75, 000 patiënten, ze ontdekten dat het een groep van negen ernstige ziekten met onverwachte nauwkeurigheid kon voorspellen. "We waren verrast, ", zegt Bayati. Vergeleken met een hypothetische Cadillac-care-beoordeling zonder limiet op het aantal biomarkers, die van hen zou veel minder kosten, toch bijna hetzelfde niveau van voorspellende kracht hebben.
En misschien is er een algemene les hier, in dit tijdperk van Big Data. "Je moet je afvragen, ", mijmert Bayati. "In elke branche, bedrijven investeren middelen om steeds meer gegevens te verzamelen. We zetten overal sensoren op, gewoon omdat het kan, en eerlijk gezegd, het is niet allemaal nodig of nuttig."
Te veel informatie
traditioneel, gezondheidsrisicobeoordelingen zijn ontworpen door de beste markers voor elke afzonderlijke ziekte uit te zoeken en deze aan een lijst toe te voegen. "Ziekenhuizen worden steeds geavanceerder in hoe ze biomarkers identificeren, met geavanceerde statistieken en nu AI, " zegt Bayati. "Maar het is allemaal met één ziekte tegelijk gedaan."
Je zou op deze manier mogelijk een effectief testpaneel kunnen bouwen, hij zegt, maar het zou veel te veel biomarkers vereisen. Dus in de praktijk er worden compromissen gesloten en de nauwkeurigheid neemt af. In plaats daarvan, Bayati en zijn collega's voegden een tweede stap toe aan de analyse:"We zeiden:laten we beginnen met die volledige lijst en dan kijken of we het op een betere manier kunnen vereenvoudigen om het verlies aan diagnostische kracht te minimaliseren."
Om dat te doen, ze maakten gebruik van enkele technieken uit hoogdimensionale statistieken die worden gebruikt bij machine learning. "De fundamentele vraag is als je te veel informatie hebt, hoe kun je het beperken tot de meest bruikbare kleinere set informatie? Hoe verklein je de afmetingen van de dataset?"
De wiskunde is betrokken, maar in principe de sleutel tot het oplossen van dat "TMI"-probleem is om gezamenlijk de selectie van biomarkers te optimaliseren. In plaats van de beste voor elke ziekte afzonderlijk te vinden, beslis eerst hoeveel biomarkers je wilt - de onderzoekers kwamen uit op 30 - en maximaliseer vervolgens de voorspellende kracht, over alle mogelijke combinaties, voor de hele reeks ziekten tegelijk.
Het model werkt omdat veel biomarkers meer dan één ziekte signaleren. Hoge bloedglucose, bijvoorbeeld, kan een teken zijn van diabetes, maar ook nierziekte, leverziekte, of hartziekte. Abnormale niveaus van alkalische fosfatase worden in verband gebracht met hartaandoeningen, leverziekte, en kanker. "Als je selectieproces geen rekening houdt met deze overlappingen, je gooit informatie weg, ' zegt Bayati.
Geen limiet aan doelstellingen
De kracht van de methode die Bayati en zijn collega's schetsen, is dat deze kan worden gebruikt om meerdere doelen tegelijk na te streven. Wat is belangrijker bij gezondheidsrisicobeoordelingen:nauwkeurigheid of kosten? Beide, natuurlijk. Willen we de ziekte van Alzheimer of arteriële ziekte voorspellen? Ja.
"Er is geen limiet aan het aantal goals, " zegt Bayati. "Je zou er 20 kunnen noemen, 30, 100 doelstellingen waarover u wilt optimaliseren. En dan kun je de informatie die je moet verzamelen beperken, want op een gegeven moment, het toevoegen van doelstellingen vereist geen extra gegevens."
Als het helpt om de belofte van bedrijfswelzijnsprogramma's waar te maken, dat is een groot probleem voor de gezondheidszorg. Maar deze benadering kan ook worden gebruikt om een reeks bedrijfsactiviteiten en overheidsbeleid te verbeteren. Wat is cruciaal, Bayati zegt, moet duidelijk zijn over de doelstellingen. Computers kunnen de analyse doen, maar mensen moeten hen vertellen wat ze moeten optimaliseren.
En dat is een stap, hij denkt, bedrijven verdoezelen te vaak. "Soms lijkt het alsof bedrijven zich gewoon haasten om gegevens te verzamelen en later vragen te stellen. Maar meer informatie is niet per se beter. Waar het om gaat, is weten waar ze naar moeten kijken. Ons artikel is een stap in die richting."
Wetenschap © https://nl.scienceaq.com