science >> Wetenschap >  >> Astronomie

Een nieuwe pijplijn voor anomaliedetectie voor astronomische ontdekkings- en aanbevelingssystemen

Locatie van drie ZTF-velden geanalyseerd in dit werk met gemarkeerde anomaliekandidaten. Krediet:Maria Pruzhinskaya (2020)

Het SNAD-team, een internationaal netwerk gevormd door onderzoekers uit Rusland, Frankrijk en de VS, heeft een pijplijn ontwikkeld om zeldzame en exotische objecten te vinden tussen de hooibergen met gegevens van astronomische onderzoeken.

Gezien de steeds groter wordende omvang van astronomische datasets, zelfs als onze telescopen onverwachte interessante astronomische verschijnselen detecteren, het is zeer onwaarschijnlijk dat we ze te midden van miljoenen of zelfs miljarden waarnemingen zullen kunnen herkennen. De oplossing ligt in automatische tools die speciaal zijn ontworpen om ongebruikelijk gedrag te herkennen dat verborgen is tussen miljarden metingen. Sommige van deze tools bestaan ​​al en worden gebruikt, bijvoorbeeld, om elke dag fraude met creditcardactiviteiten te identificeren tussen miljoenen transacties. Echter, hun aanpassing aan wetenschappelijke gegevens is niet eenvoudig vanwege de complicaties die voortkomen uit de aard van waarnemingen in de astronomie. Het SNAD-team werkt al 3 jaar aan de ontwikkeling en aanpassingen van dergelijke oplossingen aan de context van de astronomie.

Tijdens hun laatste jaarvergadering de groep concentreerde hun inspanningen op objecten waarvan de helderheid in de tijd varieert. De pijplijn combineert de sterke punten van algoritmen voor machine learning en de onvervangbare kennis van menselijke experts om een ​​robuust hulpmiddel voor het detecteren van anomalie te bouwen. Het artikel beschrijft de resultaten van het toepassen van dit raamwerk op de derde gegevensrelease van de Zwicky Transient Facility. Het proces in drie fasen omvatte kenmerkextractie op lichtcurven (die de helderheid van objecten in de loop van de tijd volgt), zoeken naar anomaliekandidaten met behulp van verschillende machine learning-algoritmen en handmatig filteren van kandidaten door een menselijke expert. Deze laatste fase omvatte ook het uitvoeren van waarnemingen met andere telescopen waar mogelijk. In dit onderzoek, 4 automatische leeralgoritmen werden gebruikt om 277 anomaliekandidaten voor menselijk onderzoek te markeren - uit een initiële dataset van 2,25 miljoen objecten.

De groep ontwikkelde ook een speciaal ontworpen webinterface die onmiddellijke visualisatie en cross-match van elke kandidaat met bestaande astronomische catalogi mogelijk maakte. Dit werd geconstrueerd om het werk te vergemakkelijken van de experts die de anomaliekandidaten moeten correleren met andere openbaar beschikbare informatie over de hemelcoördinaten die worden onderzocht.

Verduistering van een achtergrondster door de asteroïde van Barcelona, gevonden door het SNAD-team onder ZTF DR3-gegevens. Krediet:Vadim Krushinsky (2020)

Van de 277 objecten die door de machine als afwijkend worden beschouwd, 188 (68%) bleken ongebruikelijke kenmerken te vertonen als gevolg van niet-astrofysische effecten (inclusief defecten als gevolg van ZTF's beeldaftrekkingspijplijn), 66 (24%) waren objecten die al eerder waren gecatalogiseerd en 23 (8%) waren voorheen onbekende objecten. De eerste categorie omvat enkele grappige curiositeiten en de twee laatste gevallen van wetenschappelijk belang. Bijvoorbeeld, een object dat door de machine als een afwijking werd gemarkeerd, was eigenlijk de occultatie van een achtergrondster door de asteroïde van Barcelona, die vanuit het oogpunt van een waarnemer vanaf de aarde werd gedetecteerd als een variabele puntbron terwijl in werkelijkheid noch de ster noch de asteroïde daadwerkelijk van helderheid veranderde. De auteurs karakteriseerden ook terugkerende en exotische beeldaftrekkingsartefacten die interfereren met lichtcurve-analyse en een anomaliedetectiepijplijn kunnen misleiden door te denken dat het een echte, afwijkend voorwerp. Om de eerste klas snel te kunnen sorteren op de overgebleven kandidaten, ze waren in staat om een ​​eenvoudige tweedimensionale relatie te identificeren die kan worden gebruikt om in toekomstige studies mogelijk valse lichtkrommen te filteren.

Onder de tweede en derde categorie, de auteurs vonden vier supernova-kandidaten, zes voorheen niet-geclassificeerde eclipserende binaire bestanden, vier pre-hoofdreeks kandidaten, een mogelijke rode dwergvlam, en spectroscopisch een RS Canum Venaticorum ster bevestigd, onder andere anomalie kandidaten.

Het snel en moeiteloos scheiden van artefacten van interessante anomaliekandidaten is cruciaal voor huidige en binnenkort naderende observatoria van de volgende generatie, zoals de Vera Rubin Observatory Legacy Survey of Space and Time (LSST). LSST zal ongeveer 10 miljoen tijdelijke bronnen per nacht genereren - geavanceerde en robuuste algoritmen zijn nodig om al die gegevens te doorzoeken, zodat onverwachte en interessante objecten niet worden gemist, en wetenschappers kunnen deze eigenaardigheden in de ruimte beter begrijpen.

Hoofdauteur Konstantin Malanchev, onderzoeker aan de Universiteit van Illinois in Urbana-Champaign (VS) en het astronomisch instituut Sternberg van de Lomonosov Moskou (Rusland), zegt, "Het ontwerpen van specifiek speciale tools om te zoeken naar astrofysisch interessante anomalieën is onze enige optie om de volledige exploitatie van datasets waar we zo hard voor hebben gevochten te garanderen. Het SNAD-team zet zich volledig in om de astronomische gemeenschap te helpen bij het verkennen van het volledige potentieel van toekomstige datasets ."

Het artikel is geaccepteerd voor publicatie in Maandelijkse mededelingen van de Royal Astronomical Society en is ook publiekelijk beschikbaar als pre-print. De broncode en resultaten, inclusief een volledige lijst van objecten met mogelijke wetenschappelijke toepassing, evenals de pijpleidingtechnieken, zijn open voor het publiek ten behoeve van en verificatie door de astronomische gemeenschap.