science >> Wetenschap >  >> Astronomie

SpaceML.org:een nieuwe bron om AI-toepassing in ruimtewetenschap en verkenning te versnellen

Naarmate SpaceML blijft groeien, zal het helpen de kloof te overbruggen tussen gegevensopslag, code-sharing en server-side (cloud) analyse. Krediet:FDL/SETI Instituut

Het SETI Institute en Frontier Development Lab (FDL.ai) kondigen de lancering aan van SpaceML.org. SpaceML is een hulpmiddel dat AI-ready datasets beschikbaar maakt voor onderzoekers die werkzaam zijn in de ruimtewetenschap en verkenning, waardoor snelle experimenten en reproduceerbaarheid mogelijk zijn.

De SpaceML Repo is een toolbox voor machine learning en een door de gemeenschap beheerde bron om onderzoekers in staat te stellen effectiever deel te nemen aan AI voor ruimtewetenschap en verkenning. Het is ontworpen om de kloof tussen gegevensopslag, code delen en server-side (cloud) analyse.

SpaceML.org bevat datasets die klaar zijn voor analyse, ruimtewetenschapsprojecten en MLOPS-tools die zijn ontworpen om bestaande AI-workflows te versnellen naar nieuwe use-cases. De datasets en projecten bouwen voort op vijf jaar geavanceerde AI-toepassing, voltooid door FDL-teams van beginnende PhD's in AI/ML en multidisciplinaire wetenschappelijke domeinen in samenwerking met NASA, ESA en de commerciële partners van FDL. Uitdagingsgebieden zijn aardwetenschappen, maan verkenning, astrobiologie, planetaire verdediging, exploratie geneeskunde, rampenbestrijding, heliofysica en ruimteweer.

"De meest impactvolle en bruikbare toepassingen van AI en machine learning-technieken vereisen datasets die goed zijn voorbereid, georganiseerd en gestructureerd voor dergelijke benaderingen, " zei Bill Diamant, CEO van het SETI-instituut. "Vijf jaar FDL-onderzoek in een breed scala van wetenschapsdomeinen heeft het mogelijk gemaakt een aantal analyseklare datasets op te zetten die we nu graag beschikbaar stellen aan de bredere onderzoeksgemeenschap."

FDL past AI- en machine learning (ML)-technologieën toe op de wetenschap om de grenzen van onderzoek te verleggen en nieuwe tools te ontwikkelen om enkele van de grootste uitdagingen van de mensheid op te lossen, zowel hier op aarde als in de ruimte.

Projecten die op SpaceML.org worden gehost voor de onderzoeksgemeenschap zijn onder meer:

  • Een project dat het probleem aanpakt van het gebruik van ML voor het automatisch kalibreren van op de ruimte gebaseerde instrumenten die worden gebruikt om de zon te observeren. Na jaren van blootstelling aan onze ster, deze instrumenten verslechteren in de loop van de tijd - een beetje zoals staar. Herijking vereist dure klinkende raketten. Met behulp van ML, het team heeft de gegevens kunnen uitbreiden, in feite het "verwijderen" van de staar.

    "De hindernis voor veel onderzoekers om de SDOML-dataset te gaan gebruiken, en om te beginnen met het ontwikkelen van ML-oplossingen, is de wrijving die ze ervaren bij het starten, " zei Mark Cheung, Senior staffysicus bij Lockheed Martin en hoofdonderzoeker voor NASA Solar Dynamics Observatory/Atmospheric Imaging Assembly. "SpaceML geeft hen een vliegende start door de inspanning die nodig is voor verkennende gegevensanalyse en modelimplementatie te verminderen. Het toont ook reproduceerbaarheid in actie aan."

  • Een ander project laat zien hoe de gegevensreductie van een meteoorbewakingsnetwerk dat bekend staat als CAMS (Cameras for Allsky Meteor Surveillance) kan worden geautomatiseerd om nieuwe clusters van meteorenregen te identificeren - mogelijk de sporen van oude aarde die kometen kruist. Sinds de aanleg van de AI-pijpleiding zijn via CAMS in totaal negen nieuwe meteorenregen ontdekt.

    "SpaceML hielp de impact te versnellen door een team van burgerwetenschappers binnen te halen die een interpreteerbare Active Learning en AI-aangedreven meteorenclassificatie hebben ingezet om inzichten te automatiseren, waardoor de astronomen gericht onderzoek konden doen voor het SETI CAMS-project, " zei Siddha Ganju, Zelfrijdende en medische instrumenten AI Architect, Nvidia (stichtend lid van SpaceML's CAMS en Worldview Search Initiatives). "Tijdens SpaceML hebben we (1) de verwerkingspijplijn gestandaardiseerd om de tien jaar durende meteorendataset verzameld door CAMS te verwerken, en, heeft de state-of-the-art meteorenclassificatie ontwikkeld met een unieke augmentatiestrategie; (2) actief leren in de CAMS-pijplijn mogelijk gemaakt om inzichten te automatiseren; en, (3) heeft het NASA CAMS Meteor Shower Portal bijgewerkt, dat nu hemelse referentiepunten en een wetenschappelijk communicatie-instrument bevat. En het mooiste is dat toekomstige burgerwetenschappers kunnen deelnemen aan het CAMS-project door voort te bouwen op de publiek toegankelijke getrainde modellen, scripts, en webtools."

    SpaceML host ook INARA (Intelligent ExoplaNET Atmospheric RetrievAI), een pijplijn voor het ophalen van de atmosfeer op basis van een gesynthetiseerde dataset van drie miljoen planetaire spectra, om bewijs van mogelijke biologische activiteit in atmosferen van exoplaneten te detecteren - met andere woorden, "Zijn we alleen?"

    SpaceML.org streeft naar een centrale opslagplaats van projectnotebooks en datasets die zijn gegenereerd uit projecten die vergelijkbaar zijn met de hierboven genoemde. Deze projectrepositories bevatten een Google 'Co-Lab'-notebook dat gebruikers door de dataset leidt en een klein datafragment bevat voor een snelle testrit voordat de volledige dataset (die altijd erg groot is) wordt vastgelegd.

    De projecten bevatten ook de volledige dataset die wordt gebruikt voor de uitdagingen, die op aanvraag beschikbaar kunnen worden gesteld. Aanvullend, SpaceML probeert het beheer van nieuwe datasets die het resultaat zijn van lopend onderzoek te vergemakkelijken en te zijner tijd toernooien te organiseren om verbeteringen aan te brengen aan ML-modellen (en gegevens) ten opzichte van bekende benchmarks.

    "We waren bezorgd over hoe we ons AI-onderzoek reproduceerbaar konden maken, " zei James Parr, FDL-directeur en CEO, Trillium-technologieën. "We realiseerden ons dat de beste manier om dit te doen was om de gegevens gemakkelijk toegankelijk te maken, maar ook dat we zowel het onboardingproces, eerste experiment en workflow-aanpassingsproces."

    "Het probleem met de reproduceerbaarheid van AI is niet noodzakelijk, 'hier niet uitgevonden' - het is meer, 'niet genoeg tijd om het zelfs maar te proberen." We dachten dat als we analyseklare gegevens konden delen, snelle server-side experimenten en goed versiebeheer mogelijk maken, het zou het beste zijn om ervoor te zorgen dat deze tools door de gemeenschap worden opgepikt in het voordeel van iedereen."

    FDL lanceert haar programma voor 2021 op 16 juni, 2021, met onderzoekers in de VS die zeven uitdagingen op het gebied van heliofysica aanpakken, Astronautengezondheid, Planetaire Wetenschappen en Aardwetenschappen. Het programma eindigt medio augustus, met teams die hun werk presenteren in een virtueel evenement.