science >> Wetenschap >  >> Elektronica

Berkeley lab-kosmologen zijn topkandidaten in machine learning-uitdaging

Logo LHC Olympische Spelen 2020. Krediet:Gregor Kasieczka, Benjamin Nachman, David Shiho

Bij het zoeken naar nieuwe deeltjes, natuurkundigen kunnen steunen op theoretische voorspellingen die enkele goede plekken suggereren om te zoeken en enkele goede manieren om ze te vinden:het is alsof je een ruwe schets krijgt van een naald verborgen in een hooiberg.

Maar blind zoeken is een stuk ingewikkelder, als jagen in een hooiberg zonder te weten wat je zoekt.

Om erachter te komen wat conventionele computeralgoritmen en wetenschappers misschien over het hoofd zien in de enorme hoeveelheid gegevens die zijn verzameld in experimenten met deeltjesversneller, de deeltjesfysica-gemeenschap wendt zich tot machine learning, een toepassing van kunstmatige intelligentie die zichzelf kan leren om zijn zoekvaardigheden te verbeteren terwijl het een hooiberg aan gegevens doorzoekt.

In een machine learning-uitdaging die de 2020 Large Hadron Collider (LHC) Olympische Spelen wordt genoemd, een team van kosmologen van het Lawrence Berkeley National Laboratory (Berkeley Lab) van het Amerikaanse Department of Energy ontwikkelde een code die het best een nepsignaal identificeerde dat verborgen was in gesimuleerde deeltjesbotsingsgegevens.

Kosmologen? Klopt.

"Het was totaal onverwacht voor ons om zo goed te presteren, " zei George Stein, een Berkeley Lab en UC Berkeley postdoctoraal onderzoeker die deelnam aan de challenge met Uros Seljak, een Berkeley Lab kosmoloog, UC Berkeley-professor, en mededirecteur van het Berkeley Center for Cosmological Physics, waarvan Stein lid is.

tien ploegen, bestaat voornamelijk uit deeltjesfysici, deed mee aan de wedstrijd, die liep van 19 november, 2019, tot 12 januari 2020.

Stein leidde de aanpassing van een code die twee andere studentonderzoekers onder Seljaks leiding hadden ontwikkeld. De wedstrijd werd gelanceerd door de organisatoren van de conferentie Machine Learning for Jets 2020 (ML4Jets2020). Jets zijn smalle kegels van deeltjes geproduceerd in deeltjesbotsingsexperimenten die deeltjesfysici kunnen traceren om de eigenschappen van hun deeltjesbronnen te meten.

Tijdens de conferentie werden de wedstrijdresultaten bekend gemaakt, die werd gehouden aan de New York University van 15-17 januari.

Ben Nachman, een postdoctoraal onderzoeker van Berkeley Lab die deel uitmaakt van een groep die werkt aan ATLAS - een grote detector bij de LHC van CERN - diende als een van de organisatoren van evenementen en wedstrijden. David Shih, hoogleraar natuurkunde en sterrenkunde aan de Rutgers University, nu op sabbatical bij Berkeley Lab, en Gregor Kasieczka, een professor aan de Universiteit van Hamburg in Duitsland, waren medeorganisatoren.

Hoewel bij sommige computercompetities deelnemers hun codes meerdere keren kunnen indienen en testen om te meten of ze dichter bij de juiste resultaten komen, de LHC Olympics-competitie van 2020 gaf teams slechts één kans om een ​​oplossing in te dienen.

"Het leuke is dat we geen kant-en-klare tool hebben gebruikt, "Zei Seljak. "We gebruikten een tool die we hadden ontwikkeld voor ons onderzoek."

Hij merkte, "In mijn groep hadden we gewerkt aan unsupervised machine learning. Het idee is dat je data wilt beschrijven waar de data geen labels hebben."

De tool die het team gebruikte heet sliced ​​iteratief optimaal transport. "Het is een vorm van diep leren, maar een vorm waarbij we niet alles in één keer optimaliseren, "zei Seljak. "In plaats daarvan, we doen het iteratief, " in fases.

De code is zo efficiënt dat deze op een eenvoudige desktop- of laptopcomputer kan worden uitgevoerd. Het is ontwikkeld voor een statistische benadering die bekend staat als Bayesiaans bewijs.

Seljak zei, "Stel dat je naar anomalieën kijkt in de transittijd van een planeet, " de tijd die de planeet nodig heeft om vanuit jouw gezichtspunt voor een groter object langs te gaan - zoals kijken vanaf de aarde terwijl Mercurius voor de zon beweegt.

"Eén oplossing vereist dat er een extra planeet is, " hij zei, "en de andere oplossing vereist een extra maan, en ze passen allebei goed bij de gegevens, maar ze hebben heel verschillende parameters. Hoe kan ik deze twee oplossingen vergelijken?"

De Bayesiaanse benadering is om het bewijs voor beide oplossingen te berekenen en te zien welke oplossing een grotere kans heeft om waar te zijn.

"Dit soort voorbeelden komen de hele tijd voorbij, "Seljak zei, en de code van zijn team is ontworpen om de complexe berekeningen die conventionele methoden vereisen, te versnellen. "We probeerden iets te verbeteren dat niets met deeltjesfysica te maken had, en we realiseerden ons dat dit kan worden gebruikt als een algemene tool voor machine learning."

Hij voegde toe, "Onze oplossing is vooral handig voor zogenaamde anomaliedetectie:het zoeken naar zeer kleine signalen in gegevens die op de een of andere manier anders zijn dan de andere gegevens."

In de LHC Olympische Spelen van 2020, deelnemers ontvingen eerst een voorbeeldset met gegevens die deeltjessignaalgegevens opriepen van sommige achtergrondgegevens - zowel de naald als de hooiberg - waarmee deelnemers hun codes konden testen.

Toen ontvingen ze de feitelijke wedstrijdgegevens van de 'black box':alleen de hooiberg. Ze kregen de opdracht om een ​​ander en geheel onbekend soort deeltjessignaal te vinden dat verborgen was in de achtergrondgegevens, en om specifiek de signaalgebeurtenissen te beschrijven die hun methoden hebben opgeleverd.

Medeorganisatoren van de wedstrijd, Shih en Nachman, merkten op dat ze persoonlijk hadden gewerkt aan een anomalie-detectiemethode die een zeer vergelijkbare benadering (de zogenaamde "voorwaardelijke dichtheidsschatting") gebruikt als de techniek die door Seljak en Stein was ontwikkeld en die aan de wedstrijd was meegedaan.

Seljak en Stein overlegden met een aantal deeltjesfysici in het lab, inclusief Nachman, Shih, en afgestudeerde student Patrick McCormack. Ze bespraken, onder andere onderwerpen, hoe de high-energy physics-gemeenschap typisch datasets analyseert zoals die worden gebruikt in de competitie, maar voor de daadwerkelijke "black box"-uitdaging stonden Seljak en Stein er alleen voor.

Toen de wedstrijd ten einde liep, Stein zei, "We dachten ongeveer een week voor de deadline iets gevonden te hebben."

Stein en Seljak dienden een paar dagen voor de conferentie hun resultaten in, "maar aangezien we geen deeltjesfysici zijn, we waren niet van plan om aan de conferentie deel te nemen, ' zei Seljak.

Vervolgens, Stein ontving een e-mail van de organisatoren van de conferentie, die hem vroeg om naar buiten te vliegen en later die week een lezing te geven over de oplossing van het team. De organisatoren deelden de resultaten van de wedstrijd niet voordat alle sprekers hun resultaten hadden gepresenteerd.

"Mijn lezing was oorspronkelijk de eerste, en kort voor het begin van de sessie brachten ze me naar de laatste plaats. Ik wist niet of dat goed was, ' zei Steen.

De code die het Berkeley Lab-team invoerde, pakte ongeveer 1, 000 evenementen, met een foutmarge van plus of min 200, en het juiste antwoord was 843 gebeurtenissen. Hun code was de duidelijke winnaar in die categorie.

Verschillende teams waren dicht bij het schatten van het energieniveau, of "resonantiemassa, " van het signaal, en het Berkeley Lab-team was het dichtst bij de schatting van de resonantiemassa voor een secundair signaal dat afkomstig is van het hoofdsignaal.

Bij de conferentie, Stein merkte op, "Er was een enorme belangstelling voor de totaalaanpak die we volgden. Het zorgde voor opschudding."

Oz Amram, een andere deelnemer in de wedstrijd, grapte in een Twitter-bericht, "Het resultaat van de LHC Olympische Spelen... is dat kosmologen beter zijn in ons werk dan wij." Maar de organisatoren van de wedstrijd maakten formeel geen winnaar bekend.

Nachman, een van de organisatoren van evenementen, zei, "Hoewel George en Uros duidelijk beter presteerden dan de andere concurrenten, uiteindelijk is het waarschijnlijk dat geen enkel algoritme elke mogelijkheid zal dekken - dus we zullen een diverse reeks benaderingen nodig hebben om een ​​brede gevoeligheid te bereiken."

Hij voegde toe, "De deeltjesfysica is een interessante tijd ingegaan waarin elke voorspelling voor nieuwe deeltjes die we hebben getest bij de Large Hadron Collider tot nu toe niet in de natuur is gerealiseerd - behalve het standaardmodel van de deeltjesfysica. Hoewel het essentieel is om het programma voort te zetten van modelgestuurde zoekopdrachten, we moeten ook een parallel programma ontwikkelen om modelonafhankelijk te zijn. Dat is de drijfveer voor deze uitdaging."

Seljak zei dat zijn team van plan is een paper te publiceren waarin de machine learning-code wordt beschreven.

"We zijn zeker van plan om dit toe te passen op veel astrofysische problemen, " zei hij. "We zullen naar interessante toepassingen zoeken - alles met glitches of transiënten, iets abnormaals. We zullen eraan werken om de code te versnellen en krachtiger te maken. Dit soort benaderingen kunnen echt helpen."