science >> Wetenschap >  >> Elektronica

Onderzoek naar versterkingsleren om kernfusiereacties te beheersen

Ian Char werkt in de controlekamer van de DIII-D National Fusion Facility. Krediet:Jeff Schneider

Een student aan de School of Computer Science (SCS) van de Carnegie Mellon University heeft versterkend leren gebruikt om kernfusiereacties te beheersen, een belangrijke stap in de richting van het benutten van de immense kracht die wordt geproduceerd bij kernfusie als een bron van schone, overvloedige energie.

Ian Char, een promovendus bij de afdeling Machine Learning, gebruikte versterkingsleren om het waterstofplasma van de tokamak-machine te besturen in de DIII-D National Fusion Facility in San Diego. Hij was de eerste CMU-onderzoeker die een experiment uitvoerde op de gewilde machines, de eerste die versterkingsleer gebruikte om de rotatie van een tokamak-plasma te beïnvloeden, en de eerste persoon die versterkingsleer probeerde op de grootste werkende tokamak-machine in de Verenigde Staten . Char werkte samen met het Princeton Plasma Physics Laboratory (PPPL) aan het werk.

"Het leren van versterkingen beïnvloedde de druk en de rotatie van het plasma," zei Char. "En dat is echt onze grote primeur hier."

Kernfusie vindt plaats wanneer waterstofkernen samensmelten of samensmelten. Bij dit proces komt een enorme hoeveelheid energie vrij, maar het blijft een uitdaging om het niveau te handhaven dat nodig is om elektriciteit op het net te zetten. Waterstofkernen zullen alleen samensmelten onder extreem hoge temperaturen en druk, zoals die in het centrum van de zon, waar kernfusie van nature plaatsvindt. Natuurkundigen hebben ook kernfusie bereikt in thermonucleaire wapens, maar deze zijn niet bruikbaar als energiebronnen.

Een andere methode om kernfusie te produceren, maakt gebruik van magnetische velden om een ​​waterstofplasma op de vereiste temperatuur en druk te houden om de kernen te laten samensmelten. Dit proces vindt plaats in een tokamak - een enorme machine die magnetische velden gebruikt om het waterstofplasma op te sluiten in een donutvorm die een torus wordt genoemd. Om het plasma in bedwang te houden en zijn vorm te behouden, zijn honderden micromanipulaties van de magnetische velden en uitbarstingen van extra waterstofdeeltjes nodig.

Er zijn maar weinig grootschalige tokamaks actief in de wereld die dit soort onderzoek kunnen vergemakkelijken, en de tijd om er experimenten op uit te voeren is felbegeerd. De DIII-D National Fusion Facility is de enige die in de Verenigde Staten actief is.

DeepMind, een dochteronderneming voor kunstmatige intelligentie van Alphabet, het moederbedrijf van Google, was de eerste die versterkingsleer gebruikte om het magnetische veld dat de fusiereactie bevat, te beheersen. Het laboratorium hield het plasma met succes stabiel en vormde het in verschillende vormen. DeepMind voerde zijn experiment uit op de Variable Configuration Tokamak (TCV) in Lausanne, Zwitserland, en publiceerde zijn bevindingen in februari in Nature .

Char was de eerste die een soortgelijk leerexperiment met versterking uitvoerde bij DIII-D. Reinforcement learning gebruikt gegevens van eerdere pogingen om een ​​optimaal resultaat te bereiken. Tijdens het experiment van Char onderzochten algoritmen voor het leren van versterking historische en realtime gegevens om de rotatiesnelheid van het plasma te variëren en te regelen op zoek naar optimale stabiliteit.

De plasmadoughnut roteert wanneer er extra waterstofdeeltjes in worden geschoten. Het variëren van de snelheid van deze geschoten deeltjes kan het plasma mogelijk stabiliseren en het gemakkelijker maken om het vast te houden. Char gebruikte twee leeralgoritmen voor zijn experiment. In een daarvan gebruikte hij gegevens van de tokamak die gedurende meerdere jaren waren verzameld om deze te trainen in hoe het plasma reageert. Het tweede algoritme observeert de toestand van het plasma en beslist vervolgens met welke snelheid en richting de extra deeltjes moeten worden ingeschoten om de snelheid te beïnvloeden.

"Het doel op korte termijn is om de natuurkundigen de tools te geven om deze differentiële rotatie te veroorzaken, zodat ze de experimenten kunnen doen om dit plasma stabieler te maken", zegt Jeff Schneider, een onderzoeksprofessor aan het Robotics Institute en Char's Ph.D. adviseur. "Op de langere termijn toont dit werk een weg naar het gebruik van versterkingsleren om andere delen van de plasmatoestand te beheersen en uiteindelijk de temperaturen en drukken te bereiken die lang genoeg zijn om een ​​energiecentrale te hebben. Dat zou voor iedereen onbeperkte, schone energie betekenen."

Char pitchte het project vorig jaar aan DIII-D, een gebruikersfaciliteit van het Amerikaanse Department of Energy Office of Science, beheerd door General Atomics, en kreeg op 28 juni drie uur de tijd om zijn algoritmen uit te voeren. Zittend in de controlekamer van de enorme DIII-D-faciliteit en omringd door operators, Char laadde zijn algoritmen.

Char toonde aan dat zijn algoritmen de snelheid van de rotatie van het plasma konden regelen. Dit was de eerste keer dat versterkingsleren werd gebruikt om de rotatie te beheersen. Tijdens de controlesessie zijn er wat problemen naar boven gekomen en is meer testen nodig. Char keerde eind augustus terug naar DIII-D om zijn werk voort te zetten.

"Ian toonde een enorm vermogen om de fusie-apparaatspecifieke controleproblemen en plasmafysica die dit onderstrepen te verwerken", zegt Egemen Kolemen, universitair hoofddocent aan de afdeling Mechanische en Luchtvaart- en Ruimtevaarttechniek van Princeton University en een van Char's medewerkers bij PPPL. "Het is een geweldige prestatie om de theorie die hij bij CMU heeft geleerd toe te passen op een echt fusieprobleem en een experiment te leiden op een nationale fusiefaciliteit. Dat werk vereist normaal gesproken jarenlange plasmafysica en technische training." + Verder verkennen

EPFL en DeepMind gebruiken AI om plasma's voor kernfusie te controleren