Wetenschap
De PM2.5-bewakingsinstrumenten bij State Key Laboratory of Atmospheric Boundary Layer Physics and Atmospheric Chemistry (LAPC), Instituut voor Atmosferische Fysica, Chinese Wetenschapsacademie. Krediet:TANG Xiao
Monitoringgegevens van de luchtkwaliteit vormen de belangrijkste bron voor het publieke bewustzijn van luchtkwaliteit, en worden veel gebruikt in veel onderzoeksgebieden, zoals het verbeteren van de voorspelling van de luchtkwaliteit en de analyse van nevelafleveringen. Echter, er zijn uitschieters bij dergelijke monitoringgegevens, als gevolg van defecten aan het instrument, de invloed van ruwe omgevingen, en de beperking van meetmethoden.
In praktijk, handmatige inspectie wordt vaak toegepast om deze uitbijters te identificeren. Echter, omdat de hoeveelheid gegevens snel groeit, deze methode wordt steeds omslachtiger.
Om het probleem aan te pakken, Dr. Wu Huangjian en universitair hoofddocent Tang Xiao van het Institute of Atmospheric Physics, Chinese Wetenschapsacademie, een volledig automatische uitbijterdetectiemethode voorstellen op basis van de waarschijnlijkheid van residuen. De methode gebruikt meerdere regressiemethoden, en de regressieresiduen worden gebruikt om uitbijters te onderscheiden. Op basis van de standaarddeviaties van de residuen, kansen van de residuen kunnen worden berekend, en de waarnemingen met kleine waarschijnlijkheden worden gemarkeerd als uitbijters en verwijderd door een computerprogramma. Hun bevindingen zijn gepubliceerd in Vooruitgang in atmosferische wetenschappen .
"Door de kansen op residuen te introduceren, meerdere regels kunnen worden gebruikt voor het identificeren van uitbijters op hetzelfde raamwerk, " zegt Dr. Wu. "Bijvoorbeeld, door aan te nemen dat de residuen van ruimtelijke regressie en temporele regressie gehoorzamen aan een bivariate normale verdeling, ruimtelijke en temporele consistenties kunnen gelijktijdig worden geëvalueerd voor een betere identificatie van uitbijters".
De methode kan binnen een minuut mogelijk foutieve gegevens markeren in de uurlijkse waarnemingen van 1436 stations van het China National Environmental Monitoring Centre (CNEMC). Inderdaad, het is gebruikt in het luchtkwaliteitsvoorspellingssysteem van CNEMC, en wordt geïntegreerd in het datamanagementsysteem. De hoop is dat uitschieters in de realtime luchtkwaliteitsgegevens van het systeem in de nabije toekomst zullen worden verwijderd.
De methode is gepubliceerd in Vooruitgang in atmosferische wetenschappen .
Wetenschap © https://nl.scienceaq.com