Wetenschap
Artistieke impressie van de machine learning-architectuur die expliciet ijksymmetrie codeert voor een 2D-roosterveldentheorie. Credit:MIT-DeepMind-samenwerking.
Het standaardmodel van de deeltjesfysica beschrijft alle bekende elementaire deeltjes en drie van de vier fundamentele krachten die het heelal beheersen; alles behalve zwaartekracht. Deze drie krachten:elektromagnetische, sterk, en zwak - bepalen hoe deeltjes worden gevormd, hoe ze met elkaar omgaan, en hoe de deeltjes vergaan.
Deeltjes- en kernfysica bestuderen in dit kader, echter, is moeilijk, en vertrouwt op grootschalige numerieke studies. Bijvoorbeeld, veel aspecten van de sterke kracht vereisen het numeriek simuleren van de dynamiek op de schaal van 1/10e tot 1/100e van de grootte van een proton om fundamentele vragen over de eigenschappen van protonen te beantwoorden, neutronen, en kernen.
"Uiteindelijk, we zijn computationeel beperkt in de studie van protonen en nucleaire structuur met behulp van roosterveldentheorie, ", zegt assistent-professor natuurkunde Phiala Shanahan. "Er zijn veel interessante problemen die we in principe weten aan te pakken, maar we hebben gewoon niet genoeg rekenkracht, ook al draaien we op de grootste supercomputers ter wereld."
Om voorbij deze beperkingen te gaan, Shanahan leidt een groep die theoretische natuurkunde combineert met modellen voor machinaal leren. In hun paper "Equivariante stroomgebaseerde bemonstering voor roostermetertheorie, " deze maand gepubliceerd in Fysieke beoordelingsbrieven , ze laten zien hoe het opnemen van de symmetrieën van natuurkundige theorieën in machine learning en kunstmatige intelligentie-architecturen veel snellere algoritmen voor theoretische natuurkunde kan opleveren.
"We gebruiken machine learning niet om grote hoeveelheden data te analyseren, maar om de theorie van de eerste beginselen te versnellen op een manier die de striktheid van de aanpak niet in gevaar brengt, Shanahan zegt. "Dit specifieke werk toonde aan dat we machine learning-architecturen kunnen bouwen met enkele van de symmetrieën van het standaardmodel van deeltjes- en kernfysica ingebouwd, en het bemonsteringsprobleem waarop we ons richten te versnellen met orden van grootte."
Shanahan lanceerde het project met MIT-afgestudeerde student Gurtej Kanwar en met Michael Albergo, wie zit er nu op NYU. Het project breidde zich uit met de postdocs Daniel Hackett en Denis Boyda van het Centre for Theoretical Physics, NYU-professor Kyle Cranmer, en natuurkundig onderlegde machine learning-wetenschappers bij Google Deep Mind, Sébastien Racanière en Danilo Jimenez Rezende.
De paper van deze maand is er een in een reeks die gericht is op het mogelijk maken van studies in theoretische fysica die momenteel rekenkundig onhandelbaar zijn. "Ons doel is om nieuwe algoritmen te ontwikkelen voor een belangrijk onderdeel van numerieke berekeningen in de theoretische natuurkunde, " zegt Kanwar. "Deze berekeningen informeren ons over de innerlijke werking van het standaardmodel van deeltjesfysica, onze meest fundamentele theorie van materie. Dergelijke berekeningen zijn van vitaal belang om te vergelijken met resultaten van deeltjesfysica-experimenten, zoals de Large Hadron Collider bij CERN, zowel om het model nauwkeuriger in te perken en om te ontdekken waar het model kapot gaat en moet worden uitgebreid tot iets nog fundamentelers."
De enige bekende systematisch controleerbare methode om het standaardmodel van deeltjesfysica in het niet-perturbatieve regime te bestuderen, is gebaseerd op een steekproef van snapshots van kwantumfluctuaties in het vacuüm. Door de eigenschappen van deze fluctuaties te meten, once kan eigenschappen van de deeltjes en botsingen van belang afleiden.
Deze techniek brengt uitdagingen met zich mee, Kanwar legt het uit. "Deze bemonstering is duur, en we willen op fysica geïnspireerde machine learning-technieken gebruiken om veel efficiënter monsters te trekken, "zegt hij. "Machine learning heeft al grote vooruitgang geboekt bij het genereren van afbeeldingen, inclusief, bijvoorbeeld, recent werk van NVIDIA om afbeeldingen te genereren van gezichten die door neurale netwerken zijn 'verzonnen'. Denkend aan deze momentopnamen van het vacuüm als beelden, we denken dat het heel natuurlijk is om soortgelijke methoden voor ons probleem te gebruiken."
voegt Shanahan toe, "In onze benadering van het bemonsteren van deze kwantum-snapshots, we optimaliseren een model dat ons van een ruimte die gemakkelijk te bemonsteren is, naar de doelruimte brengt:gegeven een getraind model, bemonstering is dan efficiënt omdat u alleen onafhankelijke monsters hoeft te nemen in de gemakkelijk te bemonsteren ruimte, en transformeer ze via het geleerde model."
Vooral, de groep heeft een raamwerk geïntroduceerd voor het bouwen van modellen voor machinaal leren die precies een klasse van symmetrieën respecteren, genaamd "maat symmetrieën, " cruciaal voor het bestuderen van hoge-energiefysica.
Als bewijs van principe, Shanahan en collega's gebruikten hun raamwerk om machine learning-modellen te trainen om een theorie in twee dimensies te simuleren, resulterend in orde van grootte efficiëntiewinsten ten opzichte van state-of-the-art technieken en nauwkeurigere voorspellingen van de theorie. Dit maakt de weg vrij voor aanzienlijk versneld onderzoek naar de fundamentele krachten van de natuur met behulp van fysica-geïnformeerde machine learning.
De eerste paar papers van de groep als een samenwerking bespraken het toepassen van de machine-learningtechniek op een eenvoudige roosterveldentheorie, en ontwikkelde deze klasse van benaderingen op compacte, verbonden variëteiten die de meer gecompliceerde veldtheorieën van het standaardmodel beschrijven. Nu werken ze eraan om de technieken op te schalen naar state-of-the-art berekeningen.
"Ik denk dat we het afgelopen jaar hebben laten zien dat er veel belofte is in het combineren van natuurkundige kennis met machine learning-technieken, ", zegt Kanwar. "We denken actief na over hoe we de resterende barrières kunnen aanpakken om simulaties op ware grootte uit te voeren met onze aanpak. Ik hoop de komende jaren de eerste toepassing van deze methoden op berekeningen op schaal te zien. Als we de laatste obstakels kunnen overwinnen, dit belooft uit te breiden wat we kunnen doen met beperkte middelen, en ik droom ervan binnenkort berekeningen uit te voeren die ons nieuwe inzichten geven in wat ons huidige begrip van de natuurkunde te boven gaat."
Dit idee van fysica-geïnformeerd machine learning is door het team ook bekend als "ab-initio AI, " een belangrijk thema van het onlangs gelanceerde op MIT gebaseerde National Science Foundation Institute for Artificial Intelligence and Fundamental Interactions (IAIFI), waar Shanahan onderzoekscoördinator is voor natuurkundetheorie.
Wetenschap © https://nl.scienceaq.com