Wanneer water bevriest, gaat het over van een vloeibare fase naar een vaste fase, wat resulteert in een drastische verandering in eigenschappen zoals dichtheid en volume. Faseovergangen in water komen zo vaak voor dat de meesten van ons er waarschijnlijk niet eens over nadenken, maar faseovergangen in nieuwe materialen of complexe fysieke systemen zijn een belangrijk onderzoeksgebied.
Om deze systemen volledig te begrijpen, moeten wetenschappers fasen kunnen herkennen en de overgangen daartussen kunnen detecteren. Maar het kwantificeren van faseveranderingen in een onbekend systeem is vaak onduidelijk, vooral als de gegevens schaars zijn.
Onderzoekers van MIT en de Universiteit van Basel in Zwitserland pasten generatieve kunstmatige-intelligentiemodellen toe op dit probleem en ontwikkelden een nieuw machine-learning-framework dat automatisch fasediagrammen voor nieuwe fysieke systemen in kaart kan brengen.
Hun op fysica gebaseerde aanpak van machinaal leren is efficiënter dan bewerkelijke, handmatige technieken die afhankelijk zijn van theoretische expertise. Belangrijk is dat, omdat hun aanpak gebruik maakt van generatieve modellen, er geen enorme, gelabelde trainingsdatasets nodig zijn die in andere machine learning-technieken worden gebruikt.
Een dergelijk raamwerk zou wetenschappers kunnen helpen de thermodynamische eigenschappen van nieuwe materialen te onderzoeken of bijvoorbeeld verstrengeling in kwantumsystemen te detecteren. Uiteindelijk zou deze techniek het voor wetenschappers mogelijk kunnen maken om op autonome wijze onbekende fasen van materie te ontdekken.
"Als je een nieuw systeem hebt met volledig onbekende eigenschappen, hoe zou je dan kiezen welke waarneembare grootheid je wilt bestuderen? De hoop is, tenminste met datagestuurde tools, dat je grote nieuwe systemen op een geautomatiseerde manier kunt scannen, en het zal erop wijzen u op de hoogte van belangrijke veranderingen in het systeem.
"Dit zou een hulpmiddel kunnen zijn in de pijplijn van geautomatiseerde wetenschappelijke ontdekking van nieuwe, exotische eigenschappen van fasen", zegt Frank Schäfer, een postdoc in het Julia Lab in het Computer Science and Artificial Intelligence Laboratory (CSAIL) en co-auteur van een artikel over deze aanpak.
Schäfer wordt op dit papier vergezeld door eerste auteur Julian Arnold, een afgestudeerde student aan de Universiteit van Basel; Alan Edelman, hoogleraar toegepaste wiskunde bij de afdeling Wiskunde en leider van het Julia Lab; en senior auteur Christoph Bruder, professor aan de afdeling natuurkunde van de Universiteit van Basel.
Het onderzoek is gepubliceerd in Physical Review Letters .
Faseovergangen detecteren met behulp van AI
Hoewel de overgang van water naar ijs misschien wel een van de meest voor de hand liggende voorbeelden van een faseverandering is, zijn meer exotische faseveranderingen, zoals wanneer een materiaal overgaat van een normale geleider naar een supergeleider, van groot belang voor wetenschappers.
Deze overgangen kunnen worden gedetecteerd door een ‘orderparameter’ te identificeren, een grootheid die belangrijk is en waarvan verwacht wordt dat deze zal veranderen. Water bevriest bijvoorbeeld en gaat over in een vaste fase (ijs) wanneer de temperatuur onder de 0°C daalt. In dit geval zou een geschikte ordeparameter kunnen worden gedefinieerd in termen van het aandeel watermoleculen die deel uitmaken van het kristallijne rooster versus de watermoleculen die in een ongeordende staat blijven.
In het verleden vertrouwden onderzoekers op natuurkundige expertise om fasediagrammen handmatig te bouwen, op basis van theoretisch inzicht om te weten welke ordeparameters belangrijk zijn. Dit is niet alleen vervelend voor complexe systemen, en misschien onmogelijk voor onbekende systemen met nieuw gedrag, maar het introduceert ook menselijke vooroordelen in de oplossing.
Meer recentelijk zijn onderzoekers machine learning gaan gebruiken om discriminerende classificaties te bouwen die deze taak kunnen oplossen door te leren een meetstatistiek te classificeren als afkomstig uit een bepaalde fase van het fysieke systeem, op dezelfde manier waarop dergelijke modellen een afbeelding classificeren als een kat of een hond.
De MIT-onderzoekers hebben aangetoond hoe generatieve modellen kunnen worden gebruikt om deze classificatietaak veel efficiënter en op een fysica-geïnformeerde manier op te lossen.
De Julia-programmeertaal, een populaire taal voor wetenschappelijk computergebruik die ook wordt gebruikt in de inleidende lessen lineaire algebra van MIT, biedt veel hulpmiddelen die het van onschatbare waarde maken voor het construeren van dergelijke generatieve modellen, voegt Schäfer toe.
Generatieve modellen, zoals de modellen die ten grondslag liggen aan ChatGPT en Dall-E, werken doorgaans door de waarschijnlijkheidsverdeling van sommige gegevens te schatten, die ze gebruiken om nieuwe gegevenspunten te genereren die bij de verdeling passen (zoals nieuwe kattenafbeeldingen die vergelijkbaar zijn met bestaande kattenafbeeldingen). .
Wanneer er echter simulaties van een fysiek systeem met behulp van beproefde wetenschappelijke technieken beschikbaar zijn, krijgen onderzoekers gratis een model van de waarschijnlijkheidsverdeling ervan. Deze verdeling beschrijft de meetstatistieken van het fysieke systeem.
Een model met meer kennis
Het inzicht van het MIT-team is dat deze kansverdeling ook een generatief model definieert waarop een classificator kan worden geconstrueerd. Ze stoppen het generatieve model in standaard statistische formules om direct een classificator te construeren in plaats van deze uit steekproeven te leren, zoals werd gedaan met discriminerende benaderingen.
"Dit is een heel mooie manier om iets dat je weet over je fysieke systeem diep in je machine-learning-schema op te nemen. Het gaat veel verder dan alleen het uitvoeren van feature-engineering op je datamonsters of eenvoudige inductieve vooroordelen", zegt Schäfer.
Deze generatieve classificator kan bepalen in welke fase het systeem zich bevindt, gegeven een bepaalde parameter, zoals temperatuur of druk. En omdat de onderzoekers de kansverdelingen die aan de metingen ten grondslag liggen rechtstreeks benaderen vanuit het fysieke systeem, beschikt de classificator over systeemkennis.
Hierdoor presteert hun methode beter dan andere machinale leertechnieken. En omdat het automatisch kan werken zonder de noodzaak van uitgebreide training, verbetert hun aanpak de rekenefficiëntie bij het identificeren van faseovergangen aanzienlijk.
Aan het eind van de dag kunnen de onderzoekers, vergelijkbaar met hoe je ChatGPT zou vragen een wiskundig probleem op te lossen, de generatieve classificatorvragen stellen zoals "behoort dit monster tot fase I of fase II?" of "is dit monster gegenereerd bij hoge of lage temperatuur?"
Wetenschappers zouden deze aanpak ook kunnen gebruiken om verschillende binaire classificatietaken in fysieke systemen op te lossen, mogelijk om verstrengeling in kwantumsystemen te detecteren (is de staat verstrengeld of niet?) of om te bepalen of theorie A of B het meest geschikt is om een bepaald probleem op te lossen. Ze zouden deze aanpak ook kunnen gebruiken om grote taalmodellen zoals ChatGPT beter te begrijpen en te verbeteren door te identificeren hoe bepaalde parameters moeten worden afgestemd, zodat de chatbot de beste resultaten geeft.
In de toekomst willen de onderzoekers ook theoretische garanties bestuderen over hoeveel metingen ze nodig zouden hebben om faseovergangen effectief te detecteren en de hoeveelheid berekeningen te schatten die daarvoor nodig zijn.