Wetenschap
Het model met gemengde effecten maakt een nauwkeurigere identificatie mogelijk van hotspots waarin atmosferische variabelen zich anders verhouden dan in andere gebieden. Krediet:John Wiley &Sons Ltd.
Een betrouwbaardere methode voor het identificeren van regio's met verschillende relaties tussen luchtvervuiling en weersomstandigheden, verbetert de detectie van vervuilingshotspots.
De relatie tussen weersomstandigheden en luchtvervuiling is complex en kan van locatie tot locatie enorm verschillen. Dit maakt het moeilijk om de bronnen van vervuiling te lokaliseren en het gedrag ervan in de atmosfeer te voorspellen. Hoewel datawetenschappers en statistici aanzienlijke vooruitgang hebben geboekt bij het worstelen met dit probleem, de enorme hoeveelheden milieugegevens en de veelheid aan variabelen, zoals windsnelheid, temperatuur en vervuilingscomponent, compromissen nodig om het probleem beheersbaar te maken.
Bijvoorbeeld, de meeste bestaande benaderingen voor het detecteren van "hotspots" in de correlatie tussen variabelen in ruimtelijke gegevens omvatten het construeren van een raster waarin de relatie tussen variabelen in een cel onafhankelijk van alle andere wordt behandeld. Hoewel dit niet helemaal realistisch is - er is vaak afhankelijkheid tussen ruimtelijke gebieden, met name in gegevens over weer en luchtverontreiniging - is het buitengewoon moeilijk om ruimtelijke hotspots te vinden en tegelijkertijd de ruimtelijke afhankelijkheidsstructuur te bepalen.
Ying Sun en Junho Lee van KAUST's Environmental Statistics Laboratory hebben een sprong voorwaarts gemaakt in het aanpakken van dit probleem met de ontwikkeling van een "gemengd effectmodel" voor hotspotdetectie.
Deze kaart laat zien hoe het mixed-effect-model de noordoostelijke VS in blokken verdeelt, waardoor ze "hotspots" kunnen identificeren. Krediet:John Wiley &Sons Ltd
"We pakken het probleem aan door een eenvoudige ruimtelijke blokstructuur te gebruiken om de ruimtelijke afhankelijkheid te benaderen, ", zegt Lee. "Hierdoor kunnen we ruimtelijke hotspots vinden die verschillende patronen vertonen, terwijl het aantal valse positieven als gevolg van ruimtelijke afhankelijkheid wordt verminderd."
De aanpak, ontwikkeld in samenwerking met Howard Chang van Emory University in de Verenigde Staten, omvat het opbreken van de regio in blokken en het achtereenvolgens toepassen van willekeurige effecten op de blokken om sterke correlaties van achtergrondvariabiliteit of "ruis" te onderdrukken. Dit heeft als bijkomend voordeel dat het een willekeurig aantal hotspotclusters in de gegevens kan identificeren, inclusief clusters die elkaar kunnen overlappen.
"De grootste uitdaging was het bepalen van een geschikte blokgrootte voor de willekeurige effecten, ", zegt Lee. "We besloten de blokgrootte af te stemmen op het bereik van ruimtelijke afhankelijkheid in de gegevens."
Het team paste hun methode toe om gegevens over luchtvervuiling boven het noordoosten van de Verenigde Staten te analyseren. Ze ontdekten dat in de zomer, de concentraties van fijn stof op micrometerschaal in de lucht (PM2,5) namen in het grootste deel van de regio toe met de temperatuur en namen af met de relatieve vochtigheid.
"Echter, met onze aanpak, we konden verschillende gebieden vinden met de tegenovergestelde trend, zoals in het Chesapeake Bay-gebied, waar er een negatief verband is tussen PM2,5 en temperatuur, en rond Maine waar er een positieve correlatie is tussen PM2,5 en relatieve vochtigheid, " zegt Leen.
Wetenschap © https://nl.scienceaq.com