Wetenschap
Zwakke lensconvergentiekaarten voor het ΛCDM-kosmologische model. Willekeurig geselecteerde kaarten uit validatiedataset (boven) en GAN-gegenereerde voorbeelden (onder). Krediet:Berkeley Lab
Terwijl kosmologen en astrofysici dieper in de donkerste uithoeken van het universum duiken, hun behoefte aan steeds krachtigere observatie- en rekenhulpmiddelen is exponentieel toegenomen. Van faciliteiten zoals het Dark Energy Spectroscopic Instrument tot supercomputers zoals het Cori-systeem van Lawrence Berkeley National Laboratory in de National Energy Research Scientific Computing (NERSC)-faciliteit, ze zijn op zoek om te verzamelen, simuleren, en analyseren van toenemende hoeveelheden gegevens die kunnen helpen bij het verklaren van de aard van dingen die we niet kunnen zien, evenals die we kunnen.
Tegen dit doel, zwaartekrachtlensing is een van de meest veelbelovende instrumenten die wetenschappers hebben om deze informatie te extraheren door hen de mogelijkheid te geven om zowel de geometrie van het universum als de groei van de kosmische structuur te onderzoeken. Gravitatielenzen vervormen beelden van verre sterrenstelsels op een manier die wordt bepaald door de hoeveelheid materie in de zichtlijn in een bepaalde richting, en het biedt een manier om naar een tweedimensionale kaart van donkere materie te kijken, volgens Deborah Bard, Groepsleider voor de Data Science Engagement Group in het National Energy Research Scientific Computing Center (NERSC) van Berkeley Lab.
"Gravitatielenzen zijn een van de beste manieren om donkere materie te bestuderen, wat belangrijk is omdat het ons veel vertelt over de structuur van het universum, "zei ze. "De meerderheid van de materie in het universum is donkere materie, die we niet direct kunnen zien, dus we moeten indirecte methoden gebruiken om te bestuderen hoe het wordt verspreid."
Maar naarmate experimentele en theoretische datasets groeien, samen met de simulaties die nodig zijn om deze gegevens in beeld te brengen en te analyseren, er is een nieuwe uitdaging ontstaan:deze simulaties zijn in toenemende mate - zelfs onbetaalbaar - rekenkundig duur. Dus computationele kosmologen nemen vaak hun toevlucht tot computationeel goedkopere surrogaatmodellen, die dure simulaties nabootsen. Recenter, echter, "Vooruitgang in diepe generatieve modellen op basis van neurale netwerken openden de mogelijkheid om robuustere en minder met de hand ontworpen surrogaatmodellen te construeren voor vele soorten simulatoren, inclusief die in de kosmologie, " zei Mustafa Mustafa, een machine learning engineer bij NERSC en hoofdauteur van een nieuwe studie die een dergelijke benadering beschrijft die is ontwikkeld door een samenwerking met Berkeley Lab, Google-onderzoek, en de Universiteit van KwaZulu-Natal.
Een verscheidenheid aan diepe generatieve modellen wordt onderzocht voor wetenschappelijke toepassingen, maar het door Berkeley Lab geleide team neemt een unieke weg in:generatieve adversariële netwerken (GAN's). In een paper gepubliceerd op 6 mei, 2019 in Computationele astrofysica en kosmologie , ze bespreken hun nieuwe deep learning-netwerk, genaamd CosmoGAN, en het vermogen om high-fidelity te creëren, zwakke convergentiekaarten voor zwaartekrachtlenzen.
"Een convergentiekaart is in feite een 2D-kaart van de zwaartekrachtlens die we aan de hemel zien langs de gezichtslijn, " zei Bard, een co-auteur op de Computationele astrofysica en kosmologie papier. "Als je een piek in een convergentiekaart hebt die overeenkomt met een piek in een grote hoeveelheid materie langs de gezichtslijn, dat betekent dat er een enorme hoeveelheid donkere materie in die richting is."
De voordelen van GAN's
Waarom kiezen voor GAN's in plaats van andere soorten generatieve modellen? Prestaties en precisie, volgens Mustafa.
"Vanuit een diepgaand leerperspectief, er zijn andere manieren om te leren hoe u convergentiekaarten kunt genereren uit afbeeldingen, maar toen we aan dit project begonnen, leken GAN's afbeeldingen met een zeer hoge resolutie te produceren in vergelijking met concurrerende methoden, terwijl het nog steeds rekenkundig en neuraal netwerk efficiënt is, " hij zei.
"We waren op zoek naar twee dingen:nauwkeurig zijn en snel zijn, " voegde co-auteur Zaria Lukic toe, een onderzoekswetenschapper in het Computational Cosmology Center van Berkeley Lab. "GAN's bieden hoop om bijna net zo nauwkeurig te zijn in vergelijking met volledige natuurkundige simulaties."
Het onderzoeksteam is vooral geïnteresseerd in het construeren van een surrogaatmodel dat de rekenkosten van het uitvoeren van deze simulaties zou verminderen. In de Computationele astrofysica en kosmologie papier, ze schetsen een aantal voordelen van GAN's in de studie van grote natuurkundige simulaties.
"Het is bekend dat GAN's erg onstabiel zijn tijdens training, vooral wanneer je helemaal aan het einde van de training komt en de afbeeldingen er mooi uit beginnen te zien - dat is wanneer de updates van het netwerk echt chaotisch kunnen zijn, "Zei Mustafa. "Maar omdat we de samenvattende statistieken hebben die we in de kosmologie gebruiken, we waren in staat om de GAN's bij elke stap van de training te evalueren, die ons hielp bij het bepalen van de generator waarvan we dachten dat deze de beste was. Deze procedure wordt meestal niet gebruikt bij het trainen van GAN's."
Met behulp van het CosmoGAN-generatornetwerk, het team is erin geslaagd convergentiekaarten te produceren die worden beschreven door - met een hoge statistische betrouwbaarheid - dezelfde samenvattende statistieken als de volledig gesimuleerde kaarten. Deze zeer hoge mate van overeenstemming tussen convergentiekaarten die statistisch niet te onderscheiden zijn van kaarten geproduceerd door op fysica gebaseerde generatieve modellen, biedt een belangrijke stap in de richting van het bouwen van emulators uit diepe neurale netwerken.
"Het enorme voordeel hier was dat het probleem dat we aanpakten een natuurkundig probleem was met bijbehorende meetgegevens, ' zei Bard. 'Maar met onze benadering, er zijn werkelijke statistieken waarmee u kunt kwantificeren hoe nauwkeurig uw GAN is. Dat is voor mij het opwindende hieraan:hoe dit soort natuurkundige problemen de machinale leermethoden kunnen beïnvloeden.
Uiteindelijk kunnen dergelijke benaderingen de wetenschap transformeren die momenteel afhankelijk is van gedetailleerde natuurkundige simulaties die miljarden rekenuren vergen en petabytes aan schijfruimte in beslag nemen, maar er is nog veel werk aan de winkel. Kosmologische gegevens (en wetenschappelijke gegevens in het algemeen) kunnen metingen met een zeer hoge resolutie vereisen, zoals full-sky telescoop beelden.
"De voor dit project overwogen 2D-beelden zijn waardevol, maar de feitelijke natuurkundige simulaties zijn 3D en kunnen in de tijd variëren en onregelmatig zijn, het produceren van een rijke, webachtige structuur van functies, " zei Wahid Bhmiji, een big data-architect in de Data and Analytics Services-groep bij NERSC en een co-auteur van de Computationele astrofysica en kosmologie papier. "In aanvulling, de aanpak moet worden uitgebreid om nieuwe virtuele universums te verkennen in plaats van degenen die al zijn gesimuleerd - om uiteindelijk een beheersbare CosmoGAN te bouwen."
"Het idee om controleerbare GAN's te maken, is in wezen de heilige graal van het hele probleem waaraan we werken:om de fysieke simulators echt te kunnen emuleren die we nodig hebben om surrogaatmodellen te bouwen op basis van controleerbare GAN's, " voegde Mustafa toe. "Op dit moment proberen we te begrijpen hoe we de trainingsdynamiek kunnen stabiliseren, gezien alle vorderingen op het gebied van de afgelopen jaren. Het stabiliseren van de training is enorm belangrijk om daadwerkelijk te kunnen doen wat we hierna willen gaan doen."
Wetenschap © https://nl.scienceaq.com