science >> Wetenschap >  >> Natuur

Wat kan machine learning onthullen over de vaste aarde?

Geowetenschappers hebben een techniek gebruikt die vaak wordt gebruikt voor spraakherkenning om gebeurtenissen te detecteren, variërend van alpiene aardverschuivingen tot vulkanische waarschuwingssignalen die anders onopgemerkt zouden blijven. Krediet:USGS Hawaiian Volcano Observatory

Wetenschappers die het innerlijke uurwerk van de aarde willen begrijpen, hebben legers sensoren ingezet die luisteren naar tekenen van slippen, rommelt, uitademingen en andere verstoringen die afkomstig zijn van de diepste fouten van de planeet tot de hoogste vulkanen. "We meten continu de beweging van de grond, meestal verzamelen van 100 monsters per seconde bij honderden tot duizenden instrumenten, " zei geofysicus Gregory Beroza van Stanford. "Het is gewoon een enorme stroom gegevens."

Maar het vermogen van wetenschappers om betekenis te extraheren uit deze informatie heeft geen gelijke tred gehouden.

De vaste aarde, de oceanen en de atmosfeer vormen samen een geosysteem waarin fysieke, biologische en chemische processen interageren op schalen van milliseconden tot miljarden jaren, en van de grootte van een enkel atoom tot die van een hele planeet. "Al deze dingen zijn op een bepaald niveau gekoppeld, " legde Beroza uit, de Wayne Loel Professor in de School of Earth, Energie- en milieuwetenschappen (Stanford Earth). "We begrijpen de individuele systemen niet, en we begrijpen hun relaties met elkaar niet."

Nutsvoorzieningen, zoals Beroza en co-auteurs schetsen in een paper gepubliceerd op 21 maart in het tijdschrift Wetenschap , machine learning-algoritmen die zijn getraind om de structuur van steeds groter wordende geologische gegevensstromen te verkennen, voortbouwen op observaties terwijl ze gaande zijn en betekenis geven aan steeds complexere, uitgestrekte simulaties helpen wetenschappers hardnekkige vragen te beantwoorden over hoe de aarde werkt.

Van automatisering tot ontdekking

"Toen ik vijf jaar geleden begon samen te werken met aardwetenschappers, er was interesse en nieuwsgierigheid rond machine learning en data science, " herinnerde Karianne Bergen zich, hoofdauteur van het artikel en een onderzoeker bij het Harvard Data Science Initiative die haar doctoraat in computationele en wiskundige engineering aan Stanford behaalde. "Maar de gemeenschap van onderzoekers die machine learning gebruikten voor geowetenschappelijke toepassingen was relatief klein."

Dat verandert snel. De meest eenvoudige toepassingen van machine learning in aardwetenschappen automatiseren repetitieve taken zoals het categoriseren van vulkanische asdeeltjes en het identificeren van de piek in een reeks seismische bewegingen die het begin van een aardbeving aangeven. Dit type machine learning is vergelijkbaar met toepassingen op andere gebieden die een algoritme kunnen trainen om kanker in medische beelden te detecteren op basis van een reeks voorbeelden die door een arts zijn gelabeld. Meer geavanceerde algoritmen die nieuwe ontdekkingen in de aardwetenschappen en daarbuiten ontsluiten, kunnen patronen beginnen te herkennen zonder te werken met bekende voorbeelden.

"Stel dat we een aardbevingsdetector ontwikkelen op basis van bekende aardbevingen. Hij gaat aardbevingen vinden die op bekende aardbevingen lijken, " legde Beroza uit. "Het zou veel spannender zijn om aardbevingen te vinden die er niet uitzien als bekende aardbevingen." Beroza en collega's van Stanford hebben precies dat kunnen doen door een algoritme te gebruiken dat elke herhalende handtekening in de reeksen wiggles markeert. opgepikt door seismografen - de instrumenten die trillingen van aardbevingen registreren - in plaats van alleen te jagen op de patronen die door aardbevingen zijn veroorzaakt die wetenschappers eerder hebben gecatalogiseerd.

Geofysicus Gregory Beroza behoort tot een groeiend aantal wetenschappers die algoritmen voor machinaal leren trainen om steeds complexere simulaties van de geosystemen van de aarde te begrijpen. Krediet:Stacy Geiken

Beide soorten algoritmen - die met expliciete labeling in de trainingsgegevens en die zonder - kunnen worden gestructureerd als diepe neurale netwerken, die fungeren als een systeem met veel lagen waarin de resultaten van een transformatie van gegevens in de ene laag dienen als invoer voor een nieuwe berekening in de volgende laag. Onder andere inspanningen die in de krant worden vermeld, dit soort netwerken hebben geowetenschappers in staat gesteld om snel de snelheid van seismische golven te berekenen - een cruciale berekening voor het schatten van de aankomsttijden van aardbevingen - en om onderscheid te maken tussen trillingen veroorzaakt door de natuurlijke beweging van de aarde in tegenstelling tot explosies.

Een onvolmaakte nabootsing

Naast het opsporen van over het hoofd geziene patronen, machine learning kan ook helpen om overweldigende datasets te temmen. Modelleren hoe een aardbeving het stroperige deel van de laag in het binnenste van de aarde beïnvloedt dat zich honderden kilometers onder de buitenste korst van de planeet uitstrekt, bijvoorbeeld, vereist onoverkomelijk veel rekenkracht. Maar algoritmen voor machine learning kunnen snelkoppelingen vinden, in wezen nabootsen van oplossingen voor meer gedetailleerde vergelijkingen met minder rekenkracht.

"We kunnen een redelijk goede benadering van de werkelijkheid krijgen, die we kunnen toepassen op datasets die zo groot zijn of simulaties die zo uitgebreid zijn dat de krachtigste beschikbare computers ze niet zouden kunnen verwerken, ' zei Beroza.

Bovendien, eventuele tekortkomingen in de precisie van op kunstmatige intelligentie gebaseerde oplossingen voor deze vergelijkingen verbleken vaak in betekenis in vergelijking met de invloed van de eigen beslissingen van wetenschappers over het opzetten van berekeningen in de eerste plaats. "Onze grootste bron van fouten komt niet van ons onvermogen om de vergelijkingen op te lossen, "Zei Beroza. "Het komt door te weten hoe de interne structuur van de aarde er echt uitziet en de parameters die in die vergelijkingen moeten worden opgenomen."

open wetenschap

Om zeker te zijn, machine learning is verre van een perfect hulpmiddel om de neteligste vragen in de aardwetenschappen te beantwoorden. "De krachtigste algoritmen voor machine learning vereisen doorgaans grote gelabelde datasets, die voor veel geowetenschappelijke toepassingen niet beschikbaar zijn, "Zei Bergen. Als wetenschappers een algoritme trainen op onvoldoende of onjuist gelabelde gegevens, ze waarschuwde, het kan ertoe leiden dat modellen vooroordelen reproduceren die niet noodzakelijkerwijs de werkelijkheid weerspiegelen.

Dit soort fouten kan gedeeltelijk worden bestreden door meer transparantie en het creëren van "benchmark"-datasets, waarvan de onderzoekers beweren dat ze de concurrentie kunnen stimuleren en appels-tot-appels-vergelijkingen van algoritmeprestaties mogelijk maken. Volgens Bergen, "Toepassing van open wetenschapsprincipes, inclusief het delen van data en code, zal helpen om het onderzoek te versnellen en de gemeenschap ook in staat te stellen beperkingen of zwakke punten van voorgestelde benaderingen te identificeren en aan te pakken."

Menselijk ongeduld is misschien moeilijker in toom te houden. "Waar ik me zorgen over maak, is dat mensen naïef AI gaan gebruiken, "Zei Beroza. "Je kunt je voorstellen dat iemand een veellaags, diep neuraal netwerk om aardbevingen te voorspellen - en dan de methode niet te testen op een manier die de voorspellende waarde ervan goed valideert."