Wetenschap
Door over te stappen van een handmatige naar een geautomatiseerde experimenteerbenadering, kunnen wetenschappers parameterruimten grondiger verkennen. Met kunstmatige intelligentie (AI) besluitvormingsmethoden, wetenschappers kunnen zich verdiepen in belangrijke delen van de parameterruimte (hier, samenstelling en temperatuur) voor versnelde materiaalontdekking. Krediet:Brookhaven National Laboratory
In de populaire opvatting van de traditionele wetenschap, wetenschappers in het lab zweven over hun experimenten, elk klein detail micromanagen. Bijvoorbeeld, ze kunnen een grote verscheidenheid aan materiaalsamenstellingen iteratief testen, synthese- en verwerkingsprotocollen, en omgevingsomstandigheden om te zien hoe deze parameters de materiaaleigenschappen beïnvloeden. In elke iteratie, ze analyseren de verzamelde gegevens, patronen zoeken en op basis van hun wetenschappelijke kennis en intuïtie bruikbare vervolgmetingen selecteren.
Deze handmatige benadering kost beperkte instrumenttijd en de aandacht van menselijke experts die zich anders op het grotere geheel zouden kunnen concentreren. Handmatige experimenten kunnen ook inefficiënt zijn, vooral wanneer er een groot aantal parameters moet worden onderzocht, en zijn onderhevig aan menselijke vooroordelen, bijvoorbeeld om te beslissen wanneer iemand voldoende gegevens heeft verzameld en een experiment kan stoppen. De conventionele manier van wetenschap bedrijven kan de enorme complexiteit van toekomstige wetenschappelijke uitdagingen niet aan. Vooruitgang in wetenschappelijke instrumenten en data-analysemogelijkheden in experimentele faciliteiten blijven snellere metingen mogelijk maken. Hoewel deze vooruitgang wetenschappers kan helpen om complexe experimentele problemen aan te pakken, ze verergeren ook het menselijke knelpunt; geen mens kan moderne experimentele tools bijhouden!
Automatisering voor ogen
Een dergelijke faciliteit die dit soort uitdagingen beheert, is de National Synchrotron Light Source II (NSLS-II) van het Brookhaven National Laboratory van het Amerikaanse Department of Energy (DOE). Door lichtstralen te richten, variërend van infrarood tot harde röntgenstralen, richting monsters op proefstations (bundellijnen), NSLS-II kan de elektronische, chemisch, en atomaire structuren van materialen. Toen wetenschappers tien jaar geleden deze bundellijnen ontwierpen, ze hadden de vooruitziende blik om automatisering mogelijk gemaakt door machine learning (ML) en kunstmatige intelligentie (AI) - nu een exploderend veld - als onderdeel van hun visie op te nemen.
"Wij dachten, zou het niet geweldig zijn als wetenschappers niet alleen sneller metingen zouden kunnen doen, maar ook intelligent kunnen verkennen - dat wil zeggen, onderzoek wetenschappelijke problemen in slimmere, efficiëntere manieren door gebruik te maken van moderne computerwetenschappelijke methoden, " zei Kevin Yager, leider van de Electronic Nanomaterials Group van het Center for Functional Nanomaterials (CFN) bij Brookhaven Lab. "In feite, bij de CFN, we hebben een van onze onderzoeksthema's gedefinieerd als versnelde ontdekking van nanomaterialen."
Dit idee voor een sterk geautomatiseerde bundellijn die op intelligente wijze wetenschappelijke problemen zou kunnen onderzoeken, werd uiteindelijk een langetermijndoel van de Complex Materials Scattering (CMS) bundellijn, ontwikkeld en beheerd door een team onder leiding van Masafumi Fukuto.
"We begonnen met het bouwen van high-throughput-mogelijkheden voor snelle metingen, zoals een monsteruitwisselingsrobot en veel in-situ tools om verschillende parameters te verkennen, zoals temperatuur, dampdruk, en vochtigheid, "zei Fukuto. "Tegelijkertijd, we begonnen na te denken over het automatiseren van niet alleen de beamline-hardware voor gegevensverzameling, maar ook over realtime gegevensanalyse en experimentele besluitvorming. De mogelijkheid om zeer snel metingen uit te voeren is nuttig en noodzakelijk, maar niet voldoende voor revolutionaire materiaalontdekking, omdat ruimten voor materiële parameters erg groot en multidimensionaal zijn."
Bijvoorbeeld, één experiment kan een parameterruimte hebben met vijf dimensies en meer dan 25, 000 verschillende punten binnen die ruimte om te verkennen. Zowel de data-acquisitie- als analysesoftware om deze grote, hoogdimensionale parameterruimten werden in huis gebouwd in Brookhaven. Voor het verzamelen van gegevens, ze bouwden bovenop Bluesky-software, die NSLS-II ontwikkelde. Om de gegevens te analyseren, Yager schreef code voor een beeldanalysesoftware genaamd SciAnalysis.
Het sluiten van de lus
in 2017, Fukuto en Yager begonnen samen te werken met Marcus Noack, toen een postdoc en nu een onderzoekswetenschapper in het Center for Advanced Mathematics for Energy Research Applications (CAMERA) van het Lawrence Berkeley National Laboratory van DOE. Tijdens zijn tijd als postdoc, Noack kreeg de opdracht om met het Brookhaven-team samen te werken aan hun autonome bundellijnconcept. specifiek, ze werkten samen om het laatste stuk te ontwikkelen om een volledig geautomatiseerde experimentele opstelling te creëren:een besluitvormingsalgoritme. Het Brookhaven-team definieerde hun behoeften, terwijl Noack zijn expertise op het gebied van toegepaste wiskunde leverde en de software schreef om aan deze behoeften te voldoen.
Door gebruik te maken van AI en ML, dit algoritme bepaalt de beste volgende metingen om te doen terwijl een experiment aan de gang is. (AI verwijst naar een machine die menselijk gedrag simuleert, terwijl ML een subveld van AI is waarin een machine automatisch leert van gegevens uit het verleden.) Om het algoritme te laten beginnen met het modelleren van een systeem, het is net zo eenvoudig als een gebruiker die de in- en uitgangen definieert:wat zijn de variabelen die ik in het experiment kan regelen, en wat ga ik meten? Maar hoe meer informatie mensen van tevoren verstrekken, zoals de verwachte reactie van het systeem of bekende beperkingen op basis van het specifieke probleem dat wordt bestudeerd, hoe robuuster de modellering zal zijn. Achter de schermen, er is een Gaussiaans proces aan het werk dat het gedrag van het systeem modelleert.
"Een Gaussiaans proces is een wiskundig rigoureuze manier om onzekerheid te schatten, " legde Yager uit. "Dat is een andere manier om kennis in mijn hoofd te zeggen. En dat is een andere manier om wetenschap te zeggen. Want in de wetenschap dat is waar we het meest in geïnteresseerd zijn:wat weet ik, en hoe goed ken ik het?"
"Dat is het ML-gedeelte ervan, " voegde Fukuto eraan toe. "Het algoritme gaat nog een stap verder. Het neemt automatisch beslissingen op basis van deze kennis en menselijke input om te selecteren welk punt zinvol is om als volgende te meten."
In een simplistisch geval, deze volgende meting zou de locatie in de parameterruimte zijn waar informatiewinst kan worden gemaximaliseerd (of onzekerheid kan worden verminderd). Het team demonstreerde dit proof of concept voor het eerst in 2019 bij de NSLS-II CMS beamline, het in beeld brengen van een nanomateriaalfilm die speciaal voor deze demonstratie is gemaakt.
Sinds dit eerste succes het team heeft het algoritme verfijnder gemaakt, het toepassen om een breed scala aan echte (in plaats van verzonnen) wetenschappelijke problemen van verschillende groepen te bestuderen, en het uitbreiden naar meer experimentele technieken en faciliteiten.
Hoewel de standaardversie van het algoritme erop gericht is onzekerheid te minimaliseren of kennisverwerving op een iteratieve manier te maximaliseren, er zijn andere manieren om na te denken over waar de experimentele aandacht op moet worden gevestigd om de meeste waarde te verkrijgen. Bijvoorbeeld, voor sommige wetenschappers de kosten van het experiment - of het nu gaat om de duur of de hoeveelheid gebruikte materialen - zijn belangrijk. Met andere woorden, het is niet juist waar je neemt de gegevens, maar hoe? duur het is om die gegevens te nemen. Anderen vinden het misschien waardevol om in te gaan op specifieke kenmerken, zoals grenzen binnen een parameterruimte of korrelgrootte van een kristal. Hoe geavanceerder, flexibele versie van het algoritme dat Noack heeft ontwikkeld, kan worden geprogrammeerd om een verhoogde gevoeligheid voor deze functies te hebben.
"Je kunt afstemmen wat je doelen zijn in het experiment, " legde Yager uit. "Dus, het kan kenniswinst zijn, of kennisverwerving gereguleerd door experimentele kosten of geassocieerd met specifieke kenmerken."
Andere verbeteringen zijn onder meer het vermogen van het algoritme om met de complexiteit van echte systemen om te gaan, zoals het feit dat materialen inhomogeen zijn, wat betekent dat ze niet op elk punt in een steekproef hetzelfde zijn. Een deel van een monster kan een uniforme samenstelling hebben, terwijl een ander een variabele samenstelling kan hebben. Bovendien, het algoritme houdt nu rekening met anisotropie, of hoe individuele parameters erg van elkaar kunnen verschillen in termen van hoe ze een systeem beïnvloeden. Bijvoorbeeld, "x" en "y" zijn equivalente parameters (het zijn beide positionele coördinaten), maar temperatuur en druk zijn dat niet.
"Gaussiaanse processen gebruiken kernels - functies die beschrijven hoe datapunten in de ruimte van elkaar afhankelijk zijn - voor interpolatie, " zei Noack. "Kernels hebben allerlei interessante wiskundige eigenschappen. Bijvoorbeeld, ze kunnen verschillende gradaties van inhomogeniteit coderen voor een monster."
De verfijning van het algoritme vergroten is slechts een deel van de uitdaging. Vervolgens, Fukuto en Yager moeten het bijgewerkte algoritme integreren in de gesloten geautomatiseerde experimentele workflow en het testen op verschillende experimenten, niet alleen die welke intern worden gedaan, maar ook die worden uitgevoerd door gebruikers.
De methode implementeren in de grotere wetenschappelijke gemeenschap
Onlangs, Fukuto, Jager, Noak, en collega's hebben de autonome methode ingezet voor verschillende echte experimenten bij verschillende NSLS-II-bundellijnen, inclusief CMS en Soft Matter Interfaces (SMI). Noack en medewerkers hebben de methode ook ingezet bij LBNL's Advanced Light Source (ALS) en het Institut Laue-Langevin (ILL), een neutronenverstrooiingsfaciliteit in Frankrijk. Het team heeft hun besluitvormingssoftware vrijgegeven, gpCAM, aan de bredere wetenschappelijke gemeenschap, zodat iedereen zijn eigen autonome experimenten kon opzetten.
In een experiment, in samenwerking met het U.S. Air Force Research Laboratory (AFRL), ze gebruikten de methode in een autonoom synchrotron-röntgenverstrooiingsexperiment bij de CMS-bundellijn. Bij röntgenverstrooiing, de röntgenstralen weerkaatsen een monster in verschillende richtingen, afhankelijk van de structuur van het monster. Het eerste doel van het experiment was om te onderzoeken hoe de geordende structuur van nanorod-polymeer composietfilms afhankelijk is van twee fabricageparameters:de snelheid van filmcoating en de chemische coating van het substraat. Het tweede doel was om deze kennis te gebruiken om de regio's van de films met de hoogste rangorde te lokaliseren en in te richten.
"Deze materialen zijn interessant voor optische coatings en sensoren, "We hebben een specifieke fabricagemethode gebruikt die industriële roll-to-roll-processen nabootst om de beste manier te vinden om deze geordende films te vormen met behulp van industrieel schaalbare processen", legt CMS-beamlinewetenschapper Ruipeng Li uit.
In een ander röntgenverstrooiingsexperiment, bij de SMI-straallijn, het algoritme identificeerde met succes gebieden van onverwachte ordening in een parameterruimte die relevant is voor de zelfassemblage van blokcopolymeerfilms. Blokcopolymeren zijn polymeren die bestaan uit twee of meer chemisch verschillende "blokken" die aan elkaar zijn gekoppeld. Door deze kenmerken te identificeren, het autonome experiment bracht een probleem met de fabricagemethode aan het licht.
"Het was niet hypothetisch - we werken al vele jaren aan dit project, " zei CFN-materiaalwetenschapper Gregory Doerk. "We hadden op de oude manier herhaald, wat experimenten doen, foto's maken op locaties die we willekeurig hebben gekozen, kijkend naar de beelden, en verbaasd zijn over wat er aan de hand is. Met de autonome benadering in een dag van experimenten bij de bundellijn, we hebben de gebreken kunnen vinden en deze meteen in de volgende ronde kunnen verhelpen. Dat is een dramatische versnelling van de normale onderzoekscyclus waar je een studie doet, ontdekken dat het niet werkte, en ga terug naar de tekentafel."
Noack en zijn medewerkers pasten de methode ook toe op een ander soort röntgentechniek genaamd autonome synchrotron-infraroodmapping, die chemische informatie over een monster kan geven. En ze demonstreerden hoe de methode kan worden toegepast op een spectroscopietechniek om autonoom fasen te ontdekken waarin elektronen zich sterk gecorreleerd gedragen en op neutronenverstrooiing om autonoom magnetische correlaties te meten.
De toekomst van autonoom experimenteren vormgeven
Volgens Yager, hun methode kan worden toegepast op elke techniek waarvoor de gegevensverzameling en gegevensanalyse al zijn geautomatiseerd. Een van de voordelen van de aanpak is dat het "natuurkundig agnostisch, " wat betekent dat het niet gebonden is aan een bepaald soort materiaal, fysiek probleem, of techniek. De fysiek betekenisvolle hoeveelheden voor de besluitvorming worden geëxtraheerd door de analyse van de onbewerkte gegevens.
"We wilden onze aanpak heel algemeen maken, zodat deze op alles kon worden toegepast en vervolgens op maat gemaakt voor specifieke problemen, " zei Yager. "Als gebruikersfaciliteit, we willen zoveel mogelijk mensen in staat stellen om interessante wetenschap te bedrijven."
In de toekomst, het team zal functionaliteit voor gebruikers toevoegen om fysica-bewustzijn op te nemen, of kennis over de materialen of fenomenen die ze bestuderen, als ze dat willen. Maar het team zal dit doen op een manier die de algemene flexibiliteit van de aanpak niet vernietigt; gebruikers kunnen deze extra kennis in- of uitschakelen.
Een ander aspect van toekomstig werk is het toepassen van de methode om real-time processen te controleren, met andere woorden, het besturen van een systeem dat dynamisch evolueert in de tijd naarmate een experiment vordert.
"Tot nu toe, we hebben ons geconcentreerd op het nemen van beslissingen over het meten of karakteriseren van voorbereide materiaalsystemen, " zei Fukuto. "We willen ook beslissingen nemen over hoe we materialen kunnen veranderen of wat voor soort materialen we willen maken. Het begrijpen van de fundamentele wetenschap achter materiële veranderingen is belangrijk voor het verbeteren van productieprocessen."
Om deze mogelijkheid te realiseren om materialen die in realtime evolueren intelligent te verkennen, moeten algoritmische en instrumentatie-uitdagingen worden overwonnen.
"De besluitvorming moet heel snel gaan, en je moet voorbeeldomgevingen bouwen om materiaalsynthese in realtime te doen terwijl je metingen doet met een röntgenstraal, ’ legde Yager uit.
Ondanks deze uitdagingen, het team is enthousiast over de toekomst van autonoom experimenteren.
"We zijn deze inspanning op zeer kleine schaal begonnen, maar het groeide uit tot iets veel groters, " zei Fukuto. "Veel mensen zijn erin geïnteresseerd, niet alleen wij. De gebruikersgemeenschap is uitgebreid, en met gebruikers die verschillende soorten problemen bestuderen, deze aanpak zou een grote impact kunnen hebben op het versnellen van een groot aantal wetenschappelijke ontdekkingen."
"Het vertegenwoordigt een heel grote verschuiving in het denken om van de oude manier van micromanagen van experimenten naar deze nieuwe visie van geautomatiseerde systemen die experimenten uitvoeren met mensen die ze op een zeer hoog niveau orkestreren, omdat ze begrijpen wat er moet gebeuren en wat de wetenschap betekent, " zei Yager. "Dat is een zeer opwindende visie voor de toekomst van de wetenschap. We zullen in de toekomst in staat zijn om problemen aan te pakken waarvan mensen 10 jaar geleden zouden hebben gezegd dat ze onmogelijk waren."
Wetenschap © https://nl.scienceaq.com