science >> Wetenschap >  >> Fysica

Machine learning verandert kwalitatief de zoektocht naar nieuwe deeltjes

Figuur 1:Schema ter illustratie van de constructie van mengmonsters voor het trainen van een zwak gecontroleerde CWoLa-classifier in de bump hunt. In de ATLAS-zoekopdracht, het resonerende kenmerk (mres) is de dijet-massa en de andere kenmerken (y) zijn de massa's van de twee jets. Credit:ATLAS Samenwerking/CERN

De ATLAS-samenwerking bij CERN onderzoekt nieuwe manieren om naar nieuwe fenomenen te zoeken. Naast een uitgebreid onderzoeksprogramma, vaak geïnspireerd door specifieke theoretische modellen, variërend van kwantumzwarte gaten tot supersymmetrie, passen natuurkundigen nieuwe modelonafhankelijke methoden toe om hun zoekopdrachten te verbreden. ATLAS heeft zojuist de eerste modelonafhankelijke zoektocht naar nieuwe deeltjes vrijgegeven met behulp van een nieuwe techniek die 'zwak toezicht' wordt genoemd.

Zoeken naar nieuwe deeltjes begint meestal met een specifiek theoretisch model. Gezien de fenomenologie en parameters van het model, natuurkundigen zullen simuleren hoe nieuwe deeltjes zouden worden geproduceerd en vervallen in de ATLAS-detector. Vervolgens simuleren ze de achtergrondprocessen van het Standaardmodel om classificaties (met of zonder machine learning) te ontwikkelen die signalen van de achtergrond scheiden. Deze classificaties bepalen het beste faseruimtegebied van de te bestuderen gegevens, waar een hypothetisch signaal wordt verwacht te worden verrijkt. Eindelijk, natuurkundigen zullen de gegevens en achtergrondvoorspelling vergelijken op zoek naar anomalieën.

De nieuwe zoekopdracht van ATLAS maakt gebruik van classifiers voor machinaal leren (neurale netwerken) die rechtstreeks op gegevens zijn ontwikkeld om hun afhankelijkheid van een specifiek model te verminderen. Dit is een belangrijke afwijking van de standaardmethoden omdat de gegevens ongelabeld zijn:het is niet bekend of een bepaalde proton-protonbotsingsgebeurtenis een achtergrond of signaal is. Deze methode, ook wel 'zwak toezicht' genoemd, maakt gebruik van structuren in de gegevens zonder dat er labels per gebeurtenis nodig zijn.

Naast deze methode, de nieuwe ATLAS-zoekopdracht maakt gebruik van een van de meest traditionele simulatie-onafhankelijke anomaliedetectiestrategieën:de 'bump hunt'. Het doel van een hobbeljacht is om te zoeken naar een gelokaliseerde "bobbel" bovenop een gladde achtergrond. Dergelijke hobbels zijn een algemeen kenmerk van veel modellen van nieuwe deeltjes, waar de hobbel plaatsvindt bij de massa van het nieuwe deeltje. De nieuwe zoektocht bouwt voort op deze sterke basis om de gevoeligheid voor een grote verscheidenheid aan hypothetische deeltjes te vergroten zonder hun eigenschappen van tevoren te specificeren.

De combinatie van bumphunt en zwak toezicht resulteert in een analyse die grotendeels vrij is van signaalmodel- en achtergrondmodelafhankelijkheid.

Figuur 2:De uitvoer van het neurale netwerk in één dijet-massabak. Als een tweedimensionale functie, de output kan gemakkelijk worden gevisualiseerd als een afbeelding, waarbij de intensiteit overeenkomt met de efficiëntie van de netwerkuitvoer in de dijet-massabak. De linker plot heeft geen signaal geïnjecteerd en de rechter plot toont de output wanneer een hypothetisch deeltje bij 3 TeV dat vervalt in twee andere deeltjes bij 200 GeV wordt toegevoegd aan de gegevens. Credit:ATLAS Samenwerking/CERN

Anomalieën detecteren met zwak toezicht

Natuurkundigen van ATLAS trainden neurale netwerken op gegevens met behulp van een techniek genaamd "Classification without labels" (CWoLa, uitgesproken als "Koala"). Bij deze benadering natuurkundigen construeren twee gemengde datasets die zijn samengesteld uit achtergrond en mogelijk ook signaal. Deze zijn identiek behalve de relatieve proporties van het potentiaalsignaal. Hoewel de signaal-vs-achtergrondlabels voor elke gebeurtenis onbekend zijn, de neurale netwerken kunnen worden getraind om onderscheid te maken tussen de twee datasets. Met voldoende gegevens en een krachtig genoeg classifier, dit is eigenlijk optimaal om het signaal van de achtergrond te onderscheiden.

De CWoLa-methode wordt gecombineerd met een bump-hunt bij het maken van de bovenstaande gemengde datasets, zoals weergegeven in figuur 1. Signaalgebeurtenissen zouden worden gekenmerkt door een gelokaliseerd resonantiegebied en een zijbandgebied. Deze regio's zouden andere functies (y) hebben die ook kunnen worden gebruikt om de neurale netwerken te trainen. Als er geen signaal is, een neuraal netwerk zou niets leren en als er een signaal is, het kan leren om het uit de achtergrond te halen.

De nieuwe ATLAS-zoekopdracht is de eerste toepassing van volledig datagestuurde, door machine learning verbeterde anomaliedetectie. De zoekopdracht onderzocht gebeurtenissen met hadronische eindtoestanden, met behulp van de onveranderlijke massa van paren deeltjes "jets" als het resonerende kenmerk en de massa's van de individuele jets als de kenmerken om de CWoLa-classificator te trainen. Met behulp van deze beperkte set functies, natuurkundigen hebben de procedure met succes vastgesteld en hebben ontdekt dat deze al gevoelig is voor een breed scala aan nieuwe deeltjes.

Natuurkundigen waren in staat om de neurale netwerken te trainen terwijl ze een statistische testfactor vermeden die de gevoeligheid van het zoeken door training en testen op dezelfde gegevens zou verminderen. Het neurale netwerk (Figuur 2) is toegewezen aan een efficiëntie. Bijvoorbeeld, 10% betekent dat 90% van de gebeurtenissen een netwerkoutput hebben die lager is dan deze waarde. Bij afwezigheid van het signaal, het netwerk zou niets moeten leren (aangezien de twee gemengde datasets hetzelfde zouden moeten zijn), maar er moet door het ontwerp een gebied zijn met een laag rendement. De rechter plot van figuur 2 laat zien dat het netwerk het geïnjecteerde signaal kan identificeren, ook al was van tevoren niet verteld waar te kijken!

Figuur 3:Bepaalde signalen worden gesimuleerd en vervolgens aan de gegevens toegevoegd om limieten in te stellen. De hier gekozen modellen vertegenwoordigen een zwaar deeltje A (met een massa van 3 TeV) dat vervalt tot twee andere nieuwe deeltjes B en C met massa's geschreven op de horizontale as. De verticale as is de limiet - lagere cijfers geven sterkere limieten aan. De nieuwe zoekopdracht wordt vergeleken met twee bestaande resultaten van ATLAS:de inclusieve dijet-zoekopdracht (rode driehoekjes) en een speciale zoekactie naar jets geproduceerd uit W- en Z-bosonen (grijs kruis). Credit:ATLAS Samenwerking/CERN

Nieuwe precisie bieden

De nieuwe zoektocht resulteerde niet in significant bewijs voor nieuwe deeltjes en het kwantificeren van wat niet werd gevonden was zijn eigen uitdaging. Gebruikelijk, natuurkundigen kunnen gewoon vragen hoeveel signaal er moet worden toegevoegd om een ​​significante overmaat te registreren, en dan wordt die hoeveelheid signaal uitgesloten verklaard omdat er geen overmaat werd waargenomen. Om vergelijkbare uitsluitingen voor deze analyse te bereiken, moesten alle neurale netwerken opnieuw worden getraind voor elk gemodelleerd signaaltype en signaalhoeveelheid.

De resulterende limieten worden weergegeven in figuur 3. Het produceren van deze plot vereiste training ongeveer 20, 000 neurale netwerken! Sommige signalen waren moeilijker te vinden voor de neurale netwerken dan andere, met die in regio's met veel achtergrond die bijzonder uitdagend blijken te zijn. Voor andere signalen, de nieuwe limieten zijn sterker dan eerdere limieten en verbeteren ten opzichte van eerdere zoekopdrachten in een vergelijkbare faseruimte.

Op zoek naar de toekomst

Deze nieuwe aanpak van ATLAS biedt veel mogelijkheden voor uitbreidingen. De zwak gecontroleerde bump-hunt zou kunnen worden toegepast op extra gebeurtenistopologieën en er zouden meer functies kunnen worden toegevoegd om de gevoeligheid voor nieuwe deeltjes te vergroten. Complexere neurale netwerken kunnen nodig zijn om plaats te bieden aan hoger-dimensionale functieruimten en dit vereist veeleisende computerbronnen. Natuurkundigen van ATLAS overwegen ook een verscheidenheid aan alternatieve anomaliedetectietechnieken, die de CWoLa-gebaseerde zoekopdracht mogelijk kunnen aanvullen. Het is waarschijnlijk dat geen enkele methode alles zal dekken - er zijn meerdere benaderingen nodig om een ​​brede, robuust, en sterke gevoeligheid voor nieuwe deeltjes.