science >> Wetenschap >  >> Fysica

Nieuwe kijk op machine learning helpt ons faseovergangen op te schalen

Een correlatieconfiguratie (linksboven) wordt gereduceerd met behulp van een nieuw ontwikkelde blokclustertransformatie (rechtsboven). Zowel de originele als de gereduceerde configuraties hebben een verbeterde schattertechniek toegepast om configuratieparen van verschillende grootte te geven (onderste rij). Met behulp van deze trainingsparen, een CNN kan leren om kleine patronen om te zetten in grote, het bereiken van een succesvolle inverse RG-transformatie. Krediet:Tokyo Metropolitan University

Onderzoekers van de Tokyo Metropolitan University hebben 'superresolutie'-machine learning-technieken verbeterd om faseovergangen te bestuderen. Ze identificeerden de belangrijkste kenmerken van hoe grote arrays van op elkaar inwerkende deeltjes zich gedragen bij verschillende temperaturen door kleine arrays te simuleren voordat een convolutioneel neuraal netwerk wordt gebruikt om een ​​goede schatting te maken van hoe een grotere array eruit zou zien met behulp van correlatieconfiguraties. De enorme besparing in rekenkosten kan unieke manieren opleveren om te begrijpen hoe materialen zich gedragen.

We zijn omringd door verschillende toestanden of fasen van materie, d.w.z. gassen, vloeistoffen, en vaste stoffen. De studie van faseovergangen, hoe de ene fase overgaat in de andere, vormt de kern van ons begrip van materie in het universum, en blijft een hot topic voor natuurkundigen. Vooral, het idee van universaliteit, waarin enorm verschillende materialen zich op vergelijkbare manieren gedragen dankzij een paar gedeelde functies, is een krachtige. Daarom bestuderen natuurkundigen modelsystemen, vaak eenvoudige rasters van deeltjes op een array die interageren via eenvoudige regels. Deze modellen distilleren de essentie van de gemeenschappelijke fysica die materialen delen en, wonderbaarlijk, vertonen nog steeds veel van de eigenschappen van echte materialen, zoals faseovergangen. Door hun elegante eenvoud, deze regels kunnen worden gecodeerd in simulaties die ons vertellen hoe materialen eruit zien onder verschillende omstandigheden.

Echter, zoals alle simulaties, het probleem begint wanneer we naar veel deeltjes tegelijk willen kijken. De benodigde rekentijd wordt bijzonder onbetaalbaar in de buurt van faseovergangen, waar de dynamiek vertraagt, en de correlatielengte, een maat voor hoe de toestand van een atoom zich verhoudt tot de toestand van een ander op enige afstand, wordt groter en groter. Dit is een reëel dilemma als we deze bevindingen willen toepassen op de echte wereld:echte materialen bevatten over het algemeen altijd veel meer ordes van grootte van atomen en moleculen dan gesimuleerde materie.

Daarom heeft een team onder leiding van professoren Yutaka Okabe en Hiroyuki Mori van de Tokyo Metropolitan University, in samenwerking met onderzoekers van het Shibaura Institute of Technology en het Bioinformatics Institute of Singapore, hebben onderzocht hoe kleinere simulaties betrouwbaar kunnen worden geëxtrapoleerd naar grotere met behulp van een concept dat bekend staat als een inverse renormalisatiegroep (RG). De renormalisatiegroep is een fundamenteel concept in het begrip van faseovergangen en leidde ertoe dat Wilson in 1982 de Nobelprijs voor de natuurkunde ontving. Onlangs, het veld ontmoette een krachtige bondgenoot in convolutionele neurale netwerken (CNN), dezelfde machine learning-tool die computervisie helpt om objecten te identificeren en handschrift te ontcijferen. Het idee zou zijn om een ​​algoritme de toestand van een kleine reeks deeltjes te geven en het te laten inschatten hoe een grotere reeks eruit zou zien. Er is een sterke analogie met het idee van afbeeldingen met een superresolutie, waar blokkerig, gepixelde afbeeldingen worden gebruikt om vloeiendere afbeeldingen met een hogere resolutie te genereren.

Trends gevonden uit simulaties van grotere systemen worden getrouw gereproduceerd door de getrainde CNN's voor zowel Ising (links) als drie-state Potts (rechts) modellen. (inzet) Correcte temperatuuraanpassing wordt bereikt met behulp van gegevens bij een willekeurige systeemgrootte. Krediet:Tokyo Metropolitan University

Het team heeft gekeken hoe dit wordt toegepast op spinmodellen van materie, waar deeltjes interageren met andere nabijgelegen deeltjes via de richting van hun spins. Eerdere pogingen hebben met name moeite gehad om dit toe te passen op systemen bij temperaturen boven een faseovergang, waar configuraties er meer willekeurig uitzien. Nutsvoorzieningen, in plaats van spinconfiguraties te gebruiken, d.w.z. eenvoudige snapshots van de richting waarin de deeltjesspins wijzen, ze beschouwden correlatieconfiguraties, waarbij elk deeltje wordt gekenmerkt door hoe vergelijkbaar zijn eigen spin is met die van andere deeltjes, vooral degenen die erg ver weg zijn. Het blijkt dat correlatieconfiguraties subtielere wachtrijen bevatten over hoe deeltjes zijn gerangschikt, vooral bij hogere temperaturen.

Zoals alle machine learning-technieken, de sleutel is om een ​​betrouwbare trainingsset te kunnen genereren. Het team ontwikkelde een nieuw algoritme genaamd de blokclustertransformatie voor correlatieconfiguraties om deze terug te brengen tot kleinere patronen. Een verbeterde schattertechniek toepassen op zowel de originele als de gereduceerde patronen, ze hadden configuratieparen van verschillende grootte op basis van dezelfde informatie. Het enige dat overblijft is om de CNN te trainen om de kleine patronen om te zetten in grotere.

De groep beschouwde twee systemen, het 2D Ising-model en het drie-staten Potts-model, beide belangrijke benchmarks voor studies van gecondenseerde materie. Voor beide, ze ontdekten dat hun CNN een simulatie van een zeer kleine reeks punten kon gebruiken om te reproduceren hoe een maat voor de correlatie g (T) veranderde over een faseovergangspunt in veel grotere systemen. In vergelijking met directe simulaties van grotere systemen, dezelfde trends werden gereproduceerd voor beide systemen, gecombineerd met een eenvoudige herschaling van de temperatuur op basis van gegevens bij een willekeurige systeemgrootte.

Een succesvolle implementatie van inverse RG-transformaties belooft wetenschappers een glimp te geven van voorheen ontoegankelijke systeemgroottes, en helpen natuurkundigen de grotere schaalkenmerken van materialen te begrijpen. Het team hoopt nu hun methode toe te passen op andere modellen die complexere functies in kaart kunnen brengen, zoals een continu aantal spins, evenals de studie van kwantumsystemen.