Wetenschap
Een artistieke illustratie van een mengsel van Gauss-processen en een licht- of deeltjesbundel die er doorheen gaat. De afbeelding verwijst naar de innerlijke werking van het algoritme in gpCAM, een softwaretool ontwikkeld door onderzoekers van de CAMERA-faciliteit van Berkeley Lab om autonome wetenschappelijke ontdekking te vergemakkelijken. Krediet:Marcus Noack, Berkeley Lab
Experimentele faciliteiten over de hele wereld staan voor een uitdaging:hun instrumenten worden steeds krachtiger, wat leidt tot een gestage toename van het volume en de complexiteit van de wetenschappelijke gegevens die ze verzamelen. Tegelijkertijd, deze tools vragen om nieuwe, geavanceerde algoritmen om van deze mogelijkheden te profiteren en steeds ingewikkelder wetenschappelijke vragen te stellen en te beantwoorden. Bijvoorbeeld, het ALS-U-project om de Advanced Light Source-faciliteit in het Lawrence Berkeley National Laboratory (Berkeley Lab) te upgraden, zal resulteren in 100 keer helderder zacht röntgenlicht en zal voorzien zijn van supersnelle detectoren die zullen leiden tot een enorme toename van de gegevensverzamelingssnelheden.
Om ten volle gebruik te maken van moderne instrumenten en faciliteiten, onderzoekers hebben nieuwe manieren nodig om de hoeveelheid gegevens die nodig is voor wetenschappelijke ontdekkingen te verminderen en om de data-acquisitiesnelheden aan te pakken die mensen niet langer kunnen bijhouden. Een veelbelovende route ligt in een opkomend veld dat bekend staat als autonome ontdekking, waar algoritmen leren van een relatief kleine hoeveelheid invoergegevens en zelf beslissen over de volgende stappen, waardoor multidimensionale parameterruimten sneller kunnen worden verkend, efficiënt, en met minimale menselijke tussenkomst.
"Steeds meer experimentele velden profiteren van deze nieuwe optimale en autonome data-acquisitie omdat, als het erop aankomt, het gaat altijd om het benaderen van een functie, gegeven luidruchtige gegevens, " zei Marcus Noack, een onderzoekswetenschapper in het Center for Advanced Mathematics for Energy Research Applications (CAMERA) van Berkeley Lab en hoofdauteur van een nieuw artikel over Gaussiaanse processen voor autonome data-acquisitie, gepubliceerd op 28 juli in Natuur beoordelingen Natuurkunde . De paper is de bekroning van een meerjarige, multinationale inspanning onder leiding van CAMERA om innovatieve autonome ontdekkingstechnieken te introduceren in een brede wetenschappelijke gemeenschap.
Stochastische processen nemen de leiding
De afgelopen jaren, autonome ontdekkingsmethoden zijn geavanceerder geworden, met stochastische processen (bijv. Gaussiaanse procesregressie [GPR]) komt naar voren als de voorkeursmethode voor het sturen van vele klassen van experimenten. Het succes van GPR bij het sturen van experimenten is te danken aan zijn probabilistische aard, waardoor we beslissingen kunnen nemen op basis van de onzekerheid van het huidige model. Dit is de kern van gpCAM, een softwaretool ontwikkeld door CAMERA.
"In tegenstelling tot diep leren, stochastische processen kunnen worden gebruikt om beslissingen te nemen op basis van relatief kleine datasets, en ze bieden onzekerheidsschattingen die het leerproces kunnen optimaliseren, ' zei Noak.
Hoewel de eerste onderzoeksinspanningen van CAMERA zich voornamelijk richtten op experimenten met synchrotronbundellijnen, een groeiend aantal wetenschappers in andere disciplines zien nu de voordelen van het opnemen van autonome ontdekkingstechnieken in hun experimentele projectworkflows. In april, een workshop over autonome ontdekking in wetenschap en techniek, gesponsord door CAMERA en voorgezeten door Noack, trok honderden wetenschappers van over de hele wereld, als gevolg van de groeiende belangstelling voor dit opkomende gebied.
“Hiermee staan we nog in de kinderschoenen, maar er is het afgelopen jaar veel vooruitgang geboekt, " zei Martin Böhm, een instrumentwetenschapper in de spectroscopiegroep van het Institut Laue-Langevin in Grenoble, Frankrijk, en een co-auteur van het Nature Reviews Physics paper. "Voor spectrometrie, bijvoorbeeld, het biedt een nieuwe manier van experimenteren en laat de instrumenten het werk doen, wat resulteert in tijdwinst voor gebruikers." Andere mogelijke toepassingsgebieden zijn onder meer natuurkunde, wiskunde, scheikunde, biologie, materiaal kunde, milieustudies, ontdekking van medicijnen, computertechnologie, en elektrotechniek.
Meerdere toepassingen in opkomst
Bijvoorbeeld, Johannes Thomas, een postdoctoraal onderzoeker in de Molecular Foundry van Berkeley Lab, gebruikt fotogekoppelde scanningsondemicroscopie om de materiaaleigenschappen van dunne-film halfgeleidersystemen te begrijpen en heeft met gpCAM gewerkt om deze inspanningen te verbeteren.
"Toepassingen op nanoschaal die gebruik maken van kunstmatige intelligentie en machine learning-algoritmen, speciaal voor scantastersystemen, al enige tijd belang hebben bij de Weber-Bargioni-groep [bij de Foundry], Thomas zei. "In de zomer van 2020 raakten we geïnteresseerd in het gebruik van Gauss-processen voor autonome ontdekking."
De groep heeft onlangs een applicatie voltooid die gebruik maakt van gpCAM binnen een Python-to-LabVIEW-interface, waar, met wat gebruikersinvoer voor initialisatie, gpCAM drijft een atomair scherpe sonde door een halfgeleidend tweedimensionaal materiaal voor hyperspectrale gegevensverzameling. De verkregen afbeeldingen vertegenwoordigen een convolutie van zowel elektronische als topografische informatie, en puntspectroscopie extraheert de lokale elektronische structuur.
"Autonoom rijden van scanning probe instrumenten, zonder de noodzaak van constant menselijk handelen, kan de prestaties van gereedschappen voor ingenieurs en wetenschappers optimaliseren door experimenten buiten kantooruren voort te zetten of routes te bieden voor gelijktijdige taken binnen een bepaalde workflow; dat is, de tool kan worden ingesteld voor een autonome run terwijl de gebruiker de toegestane tijd efficiënt kan gebruiken, "zei Thomas. "Als gevolg daarvan, we kunnen nu Gauss-processen gebruiken om defecte regio's in 2D-heterostructuren in kaart te brengen en te identificeren met sub-Ångström-resolutie."
Aaron Michelson, een afgestudeerde onderzoeker in de Oleg Gang-groep aan de Columbia University die werkt aan zelfassemblage op basis van DNA-origami, is net begonnen gpCAM toe te passen op zijn onderzoek. Voor een project, het helpt hem en zijn collega's de thermische gloeigeschiedenis van DNA-origami-superroosters op nanoschaal te onderzoeken; in een andere, het wordt gebruikt om grote datasets te ontginnen van 2D-röntgenmicroscopie-experimenten.
"DNA-nanotechnologie bij het nastreven van zelfassemblerend functioneel materiaal lijdt vaak aan een beperkt vermogen om de grote parameterruimte voor synthese te bemonsteren, " zei hij. "Dit vereist een grote hoeveelheid gegevens die moet worden verzameld of een efficiëntere oplossing voor experimenten. Autonome ontdekking kan direct worden opgenomen in zowel het ontginnen van grote datasets als het begeleiden van nieuwe experimenten. Dit stelt de onderzoeker in staat om te voorkomen dat we gedachteloos meer monsters maken en plaatst ons in de driver's seat om beslissingen te nemen."
"Noacks werk en leiderschap hebben een brede, interdisciplinaire co-design gemeenschap. Dit soort wetenschappelijke gemeenschapsvorming vormt de kern van wat CAMERA probeert te doen, " zei CAMERA-directeur James Sethian, een co-auteur op de Natuur beoordelingen Natuurkunde papier.
Wetenschap © https://nl.scienceaq.com