science >> Wetenschap >  >> Natuur

Hoe deep learning automatische clouddetectie naar nieuwe hoogten brengt

Wolken zijn er in alle soorten en maten, en nu kan een deep learning-model helpen om de fijnere details in cloudgegevens te detecteren. Krediet:Adriel Kloppenburg op Unsplash

Kinderen die op hun rug in een grasveld liggen, kunnen de wolken scannen op afbeeldingen - misschien een pluizig konijntje hier en een vurige draak daar. Vaak, atmosferische wetenschappers doen het tegenovergestelde:ze zoeken naar gegevensbeelden voor de wolken als onderdeel van hun onderzoek om aardsystemen te begrijpen.

Het handmatig pixel voor pixel labelen van databeelden is tijdrovend, dus onderzoekers vertrouwen op automatische verwerkingstechnieken, zoals clouddetectiealgoritmen. Maar de output van de algoritmen is niet zo exact als de wetenschappers willen.

Onlangs, onderzoekers van het Pacific Northwest National Laboratory van het Department of Energy werkten samen om erachter te komen of deep learning - een aparte subset van machine learning - beter kan in het identificeren van wolken in lidar-gegevens dan de huidige op fysica gebaseerde algoritmen. Het antwoord:een duidelijk "ja". Het nieuwe model ligt veel dichter bij de antwoorden waar wetenschappers toe komen, maar in slechts een fractie van de tijd.

Lidar is een teledetectie-instrument dat een gepulseerde laser uitzendt en het retoursignaal opvangt dat wordt teruggestrooid door wolkendruppels of aerosolen. Dit retoursignaal geeft informatie over de hoogte en verticale structuur van atmosferische kenmerken, zoals wolken of rooklagen. Dergelijke gegevens van lidars op de grond vormen een belangrijk onderdeel van wereldwijde prognoses.

Aardwetenschapper Donna Flynn merkte op dat, in sommige gevallen, wat de algoritmen als wolken in de lidar-afbeeldingen detecteerden, kwam niet goed overeen met wat haar deskundige oog zag. De algoritmen hebben de neiging om de wolkengrenzen te overschatten.

"Het huidige algoritme identificeert de wolken met brede penseelstreken, " zegt Flynn, een co-hoofdonderzoeker op het project. "We moeten de echte top en basis van de cloud nauwkeuriger bepalen en meerdere wolkenlagen onderscheiden."

Upgrade gestart

Tot voor kort, rekenkracht beperkte kunstmatige neurale netwerken, een soort deep learning-model, tot een klein aantal rekenlagen. Nutsvoorzieningen, met verhoogde rekenkracht beschikbaar via supercomputing-clusters, onderzoekers kunnen meer berekeningen gebruiken - elk gebouw van het vorige - in een reeks lagen. Hoe meer lagen een kunstmatig neuraal netwerk heeft, hoe krachtiger het deep learning-netwerk.

Uitzoeken wat die berekeningen zijn, maakt deel uit van de modeltraining. Beginnen, de onderzoekers hebben correct gelabelde lidar-gegevensafbeeldingen nodig, of "grondwaarheidsgegevens", voor het trainen en testen van het model. Dus, Flynn bracht vele uren door met het met de hand labelen van afbeeldingen pixel voor pixel:wolk of geen wolk. Haar oog kan de wolkengrenzen onderscheiden en wolken versus een aerosollaag. Ze nam 40 uur - het equivalent van een volledige werkweek - om ongeveer 100 dagen aan lidar-gegevens te labelen die zijn verzameld op het atmosferische observatorium van de Southern Great Plains, onderdeel van DOE's Atmosferische Stralingsmeting gebruikersfaciliteit, in Oklahoma.

Gezien de tijd en arbeidsintensief die het hand-etiketteringsproces is, Erol Cromwell, computerwetenschapper en co-hoofdonderzoeker van PNNL, gebruikte leermethoden waarvoor minimale grondwaarheidsgegevens nodig waren.

Het model leert door zelffeedback. Het vergelijkt zijn eigen prestaties met handgelabelde resultaten en past zijn berekeningen dienovereenkomstig aan, legt Cromwell uit. Het doorloopt deze stappen, elke keer verbeteren.

Cromwell zal de bevindingen van het team presenteren op de Winterconferentie van het Institute of Electrical and Electronics Engineers over toepassingen van computervisie in januari.

Doel bereikt

Met de opleiding, het deep learning-model presteert beter dan de huidige algoritmen. De precisie van het model is bijna het dubbele en veel dichter bij wat een menselijke expert zou vinden, maar in een fractie van de tijd.

De volgende stappen zijn het evalueren van de prestaties van het model op lidar-gegevens die op verschillende locaties en in verschillende seizoenen zijn verzameld. De eerste tests met gegevens van het ARM-observatorium op Oliktok Point in Alaska zijn veelbelovend.

"Een voordeel van het deep learning-model is transfer learning, ", zegt Cromwell. "We kunnen het model verder trainen met gegevens van Oliktok om de prestaties robuuster te maken."

"Het verminderen van bronnen van onzekerheid in voorspellingen van wereldwijde modellen is vooral belangrijk voor de atmosferische wetenschappelijke gemeenschap, ", zegt Flynn. "Met zijn verbeterde precisie, deep learning vergroot ons zelfvertrouwen."

Ze voegt eraan toe:"Bovendien, het geeft ons meer tijd om buiten naar echte wolken te kijken!"