science >> Wetenschap >  >> anders

Echte problemen oplossen

De INLA-aanpak ontwikkeld door Rue en collega's is gebruikt in het Malaria Atlas Project (MAP), die gratis verspreidt, nauwkeurig, actuele informatie over malaria, heeft tot doel de verspreiding van de ziekte te beperken. Krediet:MALARIA ATLAS-PROJECT

Tools ontwikkeld door Håvard Rue hebben data-analyse getransformeerd, interpretatie en communicatie, en worden breed toegepast:van het modelleren van de verspreiding van infectieziekten tot het in kaart brengen van visbestanden.

Statistiek is de wetenschap van het leren van gegevens, met statistici die waardevolle inzichten verschaffen in de meest urgente problemen waarmee de mensheid wordt geconfronteerd, zoals de gezondheidseffecten van vervuiling op de verspreiding van infectieziekten.

Onderzoekers moeten statistieken begrijpen als ze weloverwogen beslissingen willen nemen.

"Door wetenschappers de tools te bieden om problemen in de echte wereld beter te begrijpen, hebben beleidsmakers toegang tot betrouwbare gegevens voor het nemen van belangrijke beslissingen die van invloed zijn op veel aspecten van het leven, van gezondheid en milieu tot economie en sociale vraagstukken, " legt KAUST hoogleraar statistiek Håvard Rue uit.

Rue is een pionier op het gebied van computationele Bayesiaanse statistiek, een methode die waarschijnlijkheden toepast op statistische problemen, wat leidt tot snellere en nauwkeurigere voorspellingen. Zijn werk richt zich op de toepassing van geïntegreerde geneste Laplace-benaderingen (INLA), een benadering voor het uitvoeren van Bayesiaanse gevolgtrekkingen die conclusies die zijn getrokken uit statistische modellen actualiseert in het licht van nieuwe gegevens.

"De belangrijkste problemen met Bayesiaanse modellering zijn snelheid en nauwkeurigheid, " legt Rue uit. "Normaal gesproken moet je snelheid inruilen voor nauwkeurigheid, maar met INLA krijg je beide. Het is bijna te mooi om waar te zijn."

De INLA-benadering vertegenwoordigt een andere manier om hoogdimensionale datasets met duizenden metingen te analyseren - zoals die worden gebruikt voor het modelleren van het klimaat of het voorspellen van weermodellen - en zijn te complex voor methoden zoals Markov-keten Monte Carlo-bemonstering, die tijdrovend en onpraktisch zijn voor zeer grote modellen.

Om de INLA statistische methode te helpen toepassen en om steeds grotere datasets beter te kunnen analyseren, Rue en zijn collega's ontwikkelden het statistische softwarepakket R-INLA, die INLA-toepassing op diverse gebieden mogelijk maakt, van gezondheidszorg tot ecologie.

Bijvoorbeeld, Gavin Shaddick, hoogleraar Data Science and Statistics aan de Universiteit van Exeter in het Verenigd Koninkrijk, gebruikte R-INLA om een ​​database te analyseren met gegevens van meer dan 4, 300 steden in meer dan 100 landen om de gezondheids- en milieueffecten van luchtvervuiling te modelleren.

"Luchtvervuiling is een belangrijke risicofactor voor de wereldwijde gezondheid, met jaarlijks 4,2 miljoen sterfgevallen als gevolg van vervuiling door fijnstof. ", zegt Shaddick. "Zonder R-INLA zouden we deze analyses niet op wereldwijde schaal hebben kunnen uitvoeren."

Het werk, in samenwerking met de Wereldgezondheidsorganisatie (WHO), heeft aangetoond dat 92 procent van de wereldbevolking in gebieden woont die de luchtkwaliteitsrichtlijnen van de WHO overschrijden.

De methode is ook gebruikt door het Malaria Atlas Project (MAP), die gratis verspreidt, nauwkeurig, actuele informatie over malaria, en heeft tot doel de verspreiding van de ziekte te beperken. Volgens het World Malaria Report 2017 van de WHO, in 2016 waren er wereldwijd naar schatting 216 miljoen gevallen van malaria, een stijging van ongeveer 5 miljoen gevallen ten opzichte van het voorgaande jaar.

"Voordat R-INLA niet mogelijk was om gevolgtrekkingen uit te voeren voor meer dan duizend waarnemingen, waardoor dit een belangrijk hulpmiddel is om de verspreiding van malaria te begrijpen, " zegt, Samir Bhatt van de Imperial College Public School of Health in Londen, VK, die de R-INLA gebruikten om de prevalentie van verschillende vormen van malaria op wereldschaal te modelleren.

Het Center for Disease Control and Prevention (CDC) gebruikt R-INLA ook om het stijgende aantal zelfmoorden in de Verenigde Staten in kaart te brengen. een ongekend detailniveau door veranderingen in zelfmoordcijfers in meer dan 3, 000 provincies te volgen van 2005 tot 2015.

"Het begrijpen van de geografische patronen van zelfmoordcijfers helpt ons om te bepalen welke provincies hoge cijfers rapporteren en middelen nodig hebben om zelfmoord te voorkomen, " legt Diba Khan uit, senior service fellow bij de Centers for Disease Control and Prevention (CDC). "Door INLA te gebruiken, lokale volksgezondheidsinstanties kunnen fondsen toewijzen om gezondheidsresultaten te bereiken die niet alleen mogelijk zijn op basis van gegevens op staatsniveau."

De INLA-methode is ook toegepast door onderzoekers van de Katholieke Universiteit van Valparaíso om de verspreidingspatronen van garnalen voor de kust van Chili in kaart te brengen. Het heeft hen in staat gesteld om gebieden te identificeren waar vissen mogelijk is en om aanbevelingen te doen over vangstquota om de visbestanden te helpen beheren.

"Ik ben nog steeds verbaasd als ik toepassingen van INLA zie in gebieden waar ik nog nooit van heb gehoord en die buiten de kernstatistieken vallen. Dit toont aan dat wat we doen belangrijk is en een impact heeft op hoe mensen met statistieken werken, "zegt Rue.