science >> Wetenschap >  >> Natuur

Verbindingen verbeteren voor ruimtelijke analyse

De onderzoekers toonden het nut van hun factorcopulamodel aan door het toe te passen op de analyse van de dagelijkse gemiddelde temperaturen in heel Zwitserland. Alistair Scott. Krediet:Alamy stockfoto

Een statistisch model dat rekening houdt met gemeenschappelijke afhankelijkheden in ruimtelijke gegevens levert meer realistische resultaten op voor studies van temperatuur, wind- en vervuilingsniveaus.

Een statistisch model voor ruimtelijke gegevens, zoals temperaturen op verschillende locaties, die nauwkeuriger de geografische verwantschap tussen gemeten variabelen weergeeft, is ontwikkeld door onderzoekers van de King Abdullah University of Science and Technology (KAUST) in Saoedi-Arabië.

Robuuste en realistische statistische modellen zijn van cruciaal belang voor bijna alle gebieden van wetenschappelijk onderzoek en engineering. Het kiezen van het verkeerde statistische model voor een bepaalde dataset kan leiden tot een potentieel catastrofale verkeerde interpretatie van de resultaten, terwijl een model dat rekening houdt met de mechanistische relatie tussen variabelen, kan leiden tot nieuwe inzichten en ontdekkingen.

"Ruimtelijke statistiek omvat het modelleren van variabelen gemeten op verschillende ruimtelijke locaties, " zei Marc Genton, Hoogleraar Toegepaste Wiskunde en Computational Science aan KAUST. "Veel bestaande modellen, copula's genoemd, kan de ruimtelijke afhankelijkheid tussen variabelen niet goed vastleggen, zoals wanneer de afhankelijkheid tussen variabelen zwakker wordt naarmate de afstand groter wordt, zoals het geval is met temperatuur."

Gent, met zijn collega's Dr. Pavel Krupskii en Professor Raphaël Huser, ontwierp een copula die verschillende soorten afhankelijkheden tussen variabelen aankan. Hun model biedt ook een eenvoudigere interpretatie van de gegevens in vergelijking met andere modellen:deze interpretatie, simpel gezegd, zegt dat er een niet-geobserveerde gemeenschappelijke factor bestaat die alle variabelen tegelijkertijd beïnvloedt.

"Bijvoorbeeld, temperatuurgegevens in een klein geografisch gebied kunnen onderhevig zijn aan algemene weersomstandigheden, die als een gemeenschappelijke factor kan worden beschouwd, " legde Genton uit. "Om zulke situaties weer te geven, we hebben een standaard Gaussiaans model gebruikt en een gemeenschappelijke willekeurige factor toegevoegd die alle variabelen tegelijkertijd beïnvloedt, dat is een plausibele veronderstelling in veel ruimtelijke toepassingen."

Een Gaussiaans model is een van de meest fundamentele en veelzijdige statistische modellen. Het wordt gebruikt om een ​​willekeurige verdeling van waarden over een gemiddelde waarde te beschrijven die vergelijkbaar is met de klassieke klokkromme waarin de meeste gemeten waarden in de buurt van het gemiddelde voorkomen met twee staarten aan weerszijden. Deze staarten vertegenwoordigen de toenemende zeldzaamheid van significant hogere of lagere waarden van het gemiddelde. Het Gauss-model is bijzonder krachtig in de factorgebaseerde copula van Genton omdat het een natuurlijke integratie van een gemeenschappelijke factorafhankelijkheid tussen variabelen mogelijk maakt.

De onderzoekers toonden het nut van hun factorcopulamodel aan door het toe te passen op de analyse van de dagelijkse gemiddelde temperaturen in heel Zwitserland. Hun model presteerde goed in vergelijking met andere statistische benaderingen en gaf een meer robuuste weergave van de onderliggende afhankelijkheid tussen geografische locaties.

Ergens naar uitkijken, Genton legde uit, "Onze copula kan worden gebruikt om elke variabele te modelleren die herhaaldelijk in de tijd wordt gemeten op verschillende ruimtelijke locaties, zoals dag- of uurtemperatuur of windgegevens bij verschillende weerstations, of om vervuilingsniveaus te modelleren die worden gemeten met behulp van weerballonnen of satellieten."