science >> Wetenschap >  >> Natuur

Machine learning toepassen in intelligent weeradvies

Het weersvoorspellingsproces. Krediet:Li Haochen.

Weersvoorspellingen zijn een typisch probleem bij het koppelen van big data aan fysieke procesmodellen, volgens prof. Pingwen Zhang, een academicus van de Chinese Academie van Wetenschappen, Directeur van het National Engineering Laboratory for Big Data Analysis and Application Technology, Directeur van het Centrum voor Computational Science &Engineering, Peking Universiteit. Prof. Zhang is de corresponderende auteur van een gezamenlijk onderzoek door de Universiteit van Peking en het Institute of Atmospheric Physics, Chinese Wetenschapsacademie.

In het algemeen, weersvoorspelling is een grotendeels succesvolle praktijk in de geowetenschappen en, vandaag de dag, het is onlosmakelijk verbonden met numerieke weersvoorspelling (NWP). Echter, omdat de outputs van NWP en observaties verschillende systematische fouten bevatten, een "weeroverleg" is een onmisbaar onderdeel van het proces om de nauwkeurigheid van voorspellingen verder te verbeteren.

"In feite, het theoriegestuurde fysieke model en datagestuurde machine learning zijn complementaire tools. Door deze twee benaderingen te combineren, een intelligent weerconsultatiesysteem kan worden gebouwd om het huidige handmatige proces van weerconsultatie te ondersteunen, ", zegt prof. Zhang. "Een van de uitdagingen die hiermee gepaard gaan, is het bouwen van geschikte feature-engineering voor beide soorten informatie om volledig gebruik te maken van de gegevens."

Om deze problemen op te lossen, Prof. Zhang en zijn team hebben de methode "model output machine learning" (MOML) voorgesteld voor het simuleren van weerconsultatie, en dit onderzoek is onlangs gepubliceerd in Vooruitgang in atmosferische wetenschappen .

MOML is een nabewerkingsmethode gebaseerd op machine learning, die NWP-voorspellingen vergelijkt met waarnemingen via een regressiefunctie. Om de nieuwe aanpak voor nettemperatuurvoorspellingen te testen, de oppervlaktetemperatuur van 2 m in de omgeving van Peking werd gebruikt. De MOML-methode, met verschillende feature-engineering, werd vergeleken met de ECMWF-modelvoorspelling en de gewijzigde modeloutputstatistieken (MOS) -methode. MOML vertoonde betere numerieke prestaties dan het ECMWF-model en MOS, speciaal voor de winter; de nauwkeurigheid bij gebruik van MOML nam toe met respectievelijk 27,91% en 15,52%.

Weersoverleggegevens zijn uniek, en bevatten voornamelijk informatie in zowel NWP-modelgegevens als observatiegegevens. Ze hebben verschillende datastructuren en functies, wat feature-engineering tot een ingewikkelde taak maakt. De kwaliteit van feature engineering is direct van invloed op het eindresultaat. De groep van Zhang heeft verschillende feature-engineeringschema's voorgesteld na uitgebreide numerieke experimenten. Deze schema's zorgen voor de efficiëntie van de berekening en werden voor het eerst gebruikt in meteorologische studies. Prof. Zhang wijst erop dat de MOML-methode ervoor zorgt dat de waarnemingsgegevens direct deelnemen aan de berekening, en gebruikt zowel de hoog- als laagfrequente informatie van de gegevens om de voorspellingsresultaten nauwkeuriger te maken. De MOML-methode die in deze studie wordt voorgesteld, kan worden toegepast om het weer te voorspellen tijdens de komende Olympische Winterspelen van 2022, hopelijk nauwkeuriger, intelligente en efficiënte weersvoorspellingsdiensten voor dit internationale evenement.

Machine learning en deep learning bieden diverse tools voor weersvoorspellingen in het tijdperk van big data, maar er zijn ook veel uitdagingen in praktische toepassingen.

"Het is een belangrijke toekomstige onderzoeksrichting om weersvoorspellingsgegevens en gekoppelde modellen op te nemen in een hybride computerraamwerk om de structuur en kenmerken van observatie- en NWP-gegevens te verkennen en te bestuderen, en datagestuurde machine learning-algoritmen voorstellen die geschikt zijn voor weersvoorspellingen, " Prof. Zhang concludeert.