science >> Wetenschap >  >> anders

Methode om verborgen statistische structuren in milieugegevens te visualiseren

Huang Huang (links) en Ying Sun hebben een methode ontwikkeld om de spatio-temporele covariantie-eigenschappen van een dataset te visualiseren, die zullen helpen om milieugegevens te begrijpen. Krediet:KAUST

Voorspelling van klimaat en weer is gebaseerd op statistische modellen die variabiliteit op één locatie in de tijd kunnen vastleggen, evenals de relatie met andere geografische locaties. Soms kunnen toekomstige omstandigheden op de ene locatie worden voorspeld uit de huidige omstandigheden op een andere locatie, terwijl in andere gevallen een dergelijke correlatie mogelijk niet bestaat. De veronderstelling of twee locaties op de een of andere manier 'covariant' zijn, kan ingrijpende gevolgen hebben voor de nauwkeurigheid van het statistische model, en dus is de keuze van ruimte-tijd covariantie cruciaal.

Ying Sun en haar student Huang Huang van KAUST hebben nu een methode ontwikkeld om de spatio-temporele covariantie-eigenschappen van een dataset te visualiseren. het aanzienlijk vereenvoudigen van een belangrijke modelleringsstap die voorheen nauwgezette verkennende gegevensanalyse vereiste.

"We stellen een gemakkelijke en handige manier voor om de eigenschappen van de covariantiestructuur in de gegevens te visualiseren, die beoefenaars zal helpen bij het kiezen van geschikte statistische modellen voor covarianties, " zegt Sun. "In het bijzonder, deze methode is nuttig voor gegevens die schaars in de ruimte en dicht in de tijd worden waargenomen, wat vaak het geval is bij waarnemingen van bijvoorbeeld weerstations."

Sun en Huang beschouwden twee belangrijke soorten covariantie-symmetrie en scheidbaarheid. Symmetrie houdt in dat de ruimtelijk-temporele processen omkeerbaar zijn in de tijd, terwijl scheidbaarheid aangeeft dat de correlatie in tijd geen interactie heeft met die in de ruimte.

"Ervan uitgaande dat een volledig symmetrische of scheidbare covariantie leidt tot een veel eenvoudiger model en dus tot snelle berekeningen, " zegt Sun. "Echter, deze modelaanname kan in veel echte toepassingen worden geschonden, wat leidt tot minder nauwkeurige schatting en voorspelling."

Huang en Sun gebruikten een benadering voor functionele gegevensanalyse om testfuncties te construeren uit de covarianties in tijdreeksgegevens tussen locatieparen. Deze testfuncties vatten effectief de eigenschappen van scheidbaarheid of symmetrie samen en kunnen worden weergegeven als boxplots die de mate van niet-scheidbaarheid of asymmetrie laten zien.

"We hebben deze benadering toegepast op meteorologische waarnemingen en gesimuleerde weergegevens van enkele veelgebruikte klimaatmodellen, ", zegt Huang. "In de gerapporteerde voorbeelden voor een studiegebied in de Noord-Atlantische Oceaan, deze methode toonde aan dat windsnelheid en oppervlaktetemperatuur verschillende covariantiestructuren hebben in verschillende seizoenen."

De visualisatie kan relatief snel worden berekend voor een handvol meetstations, en de onderzoekers merken op dat de rekenefficiëntie voor grotere aantallen stations kan worden verbeterd door het probleem in subregio's te verdelen. Hoe dan ook, de methode biedt een waardevol hulpmiddel dat beoefenaars enorm zal helpen.