science >> Wetenschap >  >> Astronomie

Nieuwe tools om de toegang tot NASA Earth Science-gegevens te verbeteren

NASA heeft 26 aardobservatiesatellieten die de vitale functies van onze thuisplaneet bewaken. Samen met aardwetenschappelijke missies in de lucht en op de grond, hun gegevens worden opgeslagen en beheerd door het gegevens- en informatiesysteem van het aardobservatiesysteem. Krediet:NASA

NASA heeft vijf nieuwe projecten gefinancierd om tools en technologie te ontwikkelen om de enorme aardwetenschappelijke datasets van het bureau toegankelijker en gebruiksvriendelijker te maken.

Word wakker. Laptop aanzetten. Begin met het verwerken van luchtgegevens van de Adirondack-bossen in New York. Koffie maken. Ontbijt eten. Maak de veiligheidsgordel van de open laptop vast in de passagiersstoel terwijl deze cijfers blijft kraken. Naar werk rijden.

Dat was de ochtendroutine van Sara Lubkin als wetenschapper in een vroege carrière bij NASA's Goddard Space Flight Center in Greenbelt, Maryland. Eenmaal aan het werk, ze zou haar desktopcomputer gebruiken, terwijl haar laptop de volgende 12 uur ijverig besteedde aan het verwerken van instrumentgegevens in de lucht voor de relevante informatie die ze nodig had om invasieve plagen van hemlockbomen te bestuderen.

Aarde visualisatie

NASA Aardwetenschappelijke datasets bieden verschillende perspectieven en informatie over onze planeet, zoals hier te zien in deze datavisualisatie van observaties van orkaan Matthew in oktober 2016. Credits:NASA's Scientific Visualization Studio

"Ik ben geen computerwetenschapper, Ik ben een aardwetenschapper, " zei Lubkin, die nu werkt als programmamedewerker voor Advancing Collaborative Connections for Earth Systems Science van NASA Earth Science Data Systems, of ACCESS-programma. Maar haar ervaring als onderzoeker is niet uniek.

Grote hoeveelheden tijd besteden aan het simpelweg verkrijgen van aardwetenschappelijke gegevens in een bruikbare vorm voor analyse is een veelvoorkomende situatie voor onderzoekers die werken met de grote datasets die afkomstig zijn uit het NASA-veld, lucht- en satellietmissies. enorme bestanden downloaden, het omzetten van gegevensformaten, het lokaliseren van dezelfde studiegebieden in meerdere datasets, code schrijven om verschillende landtypes in een satellietbeeld te onderscheiden - dit soort taken verslinden de tijd die wetenschappers liever zouden gebruiken om de feitelijke informatie in de gegevens te analyseren.

Dat is waar het ACCESS-programma om de hoek komt kijken. Sinds 2005 onderdeel van de divisie Earth Science Data Systems, ACCESS vindt innovatieve manieren om die omslachtige verwerkingstijd te stroomlijnen. Het programma financiert tweejarige onderzoeksprojecten om het databeheer achter de schermen te verbeteren en om gebruiksklare datasets en diensten te leveren aan wetenschappers, zei Lubkin.

In juni, NASA selecteerde vijf teams van NASA, universitaire en commerciële computerwetenschappelijke onderzoekers uit de inzendingsronde van 2017 in een reeks projecten die machine learning zullen gebruiken, cloud computing en geavanceerde zoekmogelijkheden om tools te ontwikkelen om het beheer achter de schermen voor geselecteerde NASA-datasets te verbeteren.

NASA Aardwetenschappelijke datasets bieden verschillende perspectieven en informatie over onze planeet, zoals hier te zien is in deze datavisualisatie van observaties van orkaan Matthew in oktober 2016. Credit:NASA's Scientific Visualization Studio

"We investeren voortdurend in de ontwikkeling en evaluatie van de nieuwste technologieën om wetenschappelijke datasystemen te verbeteren, " zei Kevin Murphy, programmadirecteur voor NASA's Earth Science Data Systems op het NASA-hoofdkwartier in Washington. Maar meer dan dat, ze willen ervoor zorgen dat de tools en technologie echte wetenschappers helpen om echte problemen aan te pakken.

Bij elk ACCESS-project zijn aardwetenschappen en computerwetenschappers van begin tot eind betrokken, zei Murphy. "Met het ACCESS-programma we proberen het echt te begrijpen, bijvoorbeeld, hoe oceaanstromingen werken, maar we proberen dat nu te doen met data die zo groot zijn dat we een team van experts nodig hebben die kunnen samenwerken om de big science en big data-vragen op te lossen."

De projecten zullen een aanvulling vormen op het gegevensbeheer, distributie en andere diensten geleverd door het Earth Observing System Data and Information System (EOSDIS), die NASA-gegevens beheert en opslaat die zijn verzameld van aardobservatiesatellieten, vliegtuig- en veldcampagnes. EOSDIS heeft 12 onderling verbonden data- en archiefcentra verspreid over de Verenigde Staten, die per discipline zijn georganiseerd. Momenteel, deze centra bevatten 26 petabyte aan Earth-datasets - dat is 26 miljoen gigabyte, of genoeg gegevens om 52 nodig te hebben, 000 computers met elk 500 gigabyte opslagruimte. Met de lancering van nieuwe satellieten zal dat aantal naar verwachting binnen vijf jaar groeien tot 150 petabyte.

"Satellietdata is big data, " zei Jeff Walter, een van de hoofdonderzoekers van ACCESS 2017 en hoofdingenieur voor Science Data Services bij het Atmospheric Science Data Center in het Langley Research Center van NASA in Hampton, Virginia. "Het is erg complex en soms moeilijk te gebruiken, zelfs voor ervaren gebruikers. Naast het volume, waardoor het moeilijk is voor gebruikers om te verwerven, opslaan en beheren, er is ook de complexiteit van zowel het formaat als de inhoud. Gebruikers moeten vaak veel tijd besteden om te begrijpen hoe de gegevens zijn georganiseerd en wat de verschillende parameters vertegenwoordigen."

Het project van Walter is een van de drie die cloudcomputing zullen gebruiken om download- en opslagproblemen voor gebruikers te verlichten. Beginnend met twee atmosferische datasets, zijn team zal ook een manier ontwikkelen om satellietgegevensformaten om te zetten in formaten die kunnen worden gelezen door commerciële geospatiale informatiesysteemsoftware (GIS).

"Ons project heeft tot doel de toetredingsdrempel te verlagen voor een potentiële nieuwe gebruikersgemeenschap die nieuwe manieren zou kunnen vinden om deze gegevens te gebruiken, en die meer bekend zijn met GIS-tools, "zei Wouter.

De twee andere cloud computing-projecten zullen open source-verwerkings- en analysetools ontwikkelen, waaronder een ontworpen voor oceaandatasets. Een vierde project zal machine learning gebruiken om veranderingen in de tijd in landobservaties te detecteren, beginnend met het opsporen van aardverschuivingen, overstromingen en verheffing veroorzaakt door vulkanische activiteit. Het vijfde project zal een geautomatiseerde methode ontwikkelen om datasets die dezelfde locatie observeren op een rij te zetten, zodat onderzoekers meer dan één type informatie over een plaats kunnen combineren.

Na voltooiing, de ACCESS-onderzoekers zullen nauw samenwerken met de EOSDIS-teams om hun vorderingen op te nemen in de dagelijkse activiteiten van de datacenters. Als die nieuwe instrumenten eenmaal zijn ingevoerd, dat is wanneer de echte kracht van open en vrij beschikbare aardwetenschappelijke datasets kan floreren, volgens Murphy. Gebruiksvriendelijke gegevens zorgen ervoor dat ze in handen komen van besluitvormers, particuliere organisaties, wetenschappers die verwante toepassingen bestuderen en onderzoekers op verschillende gebieden die er mogelijk nieuwe toepassingen voor hebben.

"Als je deze producten open en toegankelijk maakt, je hebt veel onbedoelde, goede wetenschappelijke consequenties, ' zei Murphy, voorbeelden aanhalend, waaronder het detecteren van grondwaterbeweging vanuit de ruimte, snelle detectie van natuurbranden en het gebruik van nachtverlichting om het energieverbruik van de mens te bestuderen. "NASA heeft veel zeer waardevolle informatie, en het ACCESS-programma probeert wetenschappers echt te helpen om niet alleen primaire wetenschappelijke vragen aan te pakken, maar ons ook te helpen onze omgeving te begrijpen en onze toekomst te plannen."