science >> Wetenschap >  >> Astronomie

Onderzoeker gebruikt machine learning om stellaire objecten te classificeren uit TESS-gegevens

Deze illustratie toont lichtkrommen voor een representatieve verduisterende dubbelster (boven) en een van de kandidaat-verduisterende viervoudige stersystemen geïdentificeerd door Adam Friedman. De extra dips veroorzaakt door extra verduisteringen in het viervoudige systeem resulteren in een ingewikkelder patroon. Krediet:NASA's Goddard Space Flight Center

Een schaakspel heeft 20 mogelijke openingszetten. Stel je voor dat je in plaats daarvan wordt gevraagd om een ​​spel te starten met tientallen miljoenen openingen. Dat was de taak die aan Adam Friedman was opgedragen, een zomerstagiair in 2020 bij NASA's Goddard Space Flight Center in Greenbelt, Maryland. Een schaakkampioen op de middelbare school, Friedman analyseerde zijn tegenstander - een stortvloed aan gegevens over de helderheidsveranderingen van meer dan 70 miljoen sterren.

Met behulp van traditionele computationele benaderingen, het doorzoeken en classificeren van deze metingen had maanden kunnen duren. Met behulp van machine learning, een vorm van kunstmatige intelligentie, dit kan in seconden worden bereikt. Werken met Brian Powell, een datawetenschapper in het High Energy Astrophysics Science Archive Research Center in Goddard, Friedman heeft een computersysteem getraind om een ​​belangrijke klasse variabele sterren te identificeren zonder het expliciet te programmeren.

Machine learning stelt computers in staat om enorme hoeveelheden gegevens automatisch te verwerken en te sorteren, precies wat nodig was om de stortvloed aan geweldige gegevens te doorzoeken. Om dit te doen, Powell creëerde een neuraal netwerk - een reeks wiskundige regels die proberen onderliggende relaties in gegevens te herkennen via een proces dat nabootst, op een sterk vereenvoudigde manier, hoe het menselijk brein werkt. Om een ​​neuraal netwerk te laten functioneren, Hoewel, het moet getraind worden.

"De stage ging over het verzamelen van trainingsgegevens, ' zei Friedman, "omdat machine learning werkt door een ongelooflijk groot aantal voorbeelden te verzamelen om het model te trainen."

NASA's Transiting Exoplanet Survey Satellite (TESS) gelanceerd in april 2018 om nieuwe werelden buiten ons zonnestelsel te vinden, of exoplaneten, door helderheidsveranderingen in nabije sterren te volgen. Sinds de lancering, TESS heeft bijna de hele lucht waargenomen. tweewekelijks, de satelliet straalt enkele duizenden grote foto's terug, de zogenaamde full-frame beelden van een vooraf gepland gedeelte van de lucht.

Astronomen gebruiken de gegevens om lichtkrommen te construeren, grafieken die laten zien hoe de helderheid van een ster in de loop van de tijd verschuift. Uit de onbewerkte TESS-gegevens, Powell gebruikte de 129, 000-core Ontdek supercomputer bij NASA's Center for Climate Simulation (NCCS) in Goddard om miljoenen lichtcurven te bouwen.

"Dankzij de steun van NCCS, we konden beginnen met het bouwen van lichtcurven in enorme hoeveelheden. We hebben nu ongeveer 70 miljoen, met meer onderweg. Datawetenschap en machine learning kunnen deze ontdekkingen stimuleren, waardoor grote hoeveelheden gegevens sneller en nauwkeuriger dan ooit tevoren kunnen worden gesorteerd en verwerkt, ' zei Powell.

Uit deze enorme stapel, Friedman wilde verduisterende dubbelsterren identificeren, gepaarde sterren die afwisselend voor, of doorvoer, elkaar elke baan gezien vanaf de aarde. Tijdens elke zonsverduistering het systeem dimt naarmate de ene ster voor de andere passeert, die een dip in zijn lichtcurve veroorzaakt. "De echt handige functie van het verduisteren van binaire bestanden, en de reden dat ze de ruggengraat vormen van de astrofysica, is dat ze ons directe metingen geven van hun fundamentele eigenschappen, zoals hun massa en grootte, " zei Veselin Kostov, een onderzoekswetenschapper bij Goddard en het SETI Institute in Mountain View, Californië. "En door deze eigenschappen, afstanden tot deze systemen kunnen we direct meten. Ze bieden ons een van de weinige mogelijkheden om directe afstanden in het universum te meten."

NCCS leverde ook hun Advanced Data Analytics PlaTform Graphics Processing Unit Cluster voor het runnen van het neurale netwerk dat Powell heeft gecodeerd en Friedman heeft getraind.

Friedman zou een lichtcurve kunnen invoeren en het neurale netwerk opdracht geven om het aan een bepaalde categorie toe te wijzen. Na deze actie duizenden keren te hebben herhaald, het neurale netwerk begon groepen lichtcurven te herkennen en classificaties voor te stellen op basis van de waarschijnlijkheid dat een bepaalde curve in een bepaalde groep past. Friedman vond voorbeeldlichtkrommen voor een breed scala aan sterrenstelsels en voerde deze in totdat het netwerk leerde hoe elk er uitzag en autonoom nieuwe lichtkrommen kon identificeren. Hierdoor kon een taak die op een moderne desktopcomputer maanden zou duren, in een paar seconden worden voltooid.

Machine learning verbetert de efficiëntie van het vinden van deze stersystemen in tientallen miljoenen TESS-afbeeldingen enorm door te leren de kenmerken van een zonsverduistering te identificeren en de lichtcurve dienovereenkomstig te labelen. Maar Friedman merkte al snel een eigenaardigheid op in sommige van de lichtcurven waarvan het netwerk beweerde dat het overschaduwende binaire kandidaten waren. Ze hadden extra dips.

Zo nu en dan, stersystemen kunnen meer dan twee componenten hebben. Als deze sterren elkaar verduisteren, dan heeft de lichtcurve extra dimmingen die, op het eerste gezicht, verschijnen met onregelmatige tussenpozen. Friedman ontdekte dat ze kandidaten waren voor multistar-systemen en begon toen een uitputtende zoektocht naar vergelijkbare systemen tussen de verduisterende binaries die door het neurale netwerk werden geïdentificeerd. In totaal, Friedman vond acht nieuwe kandidaat-viervoudige stersystemen. Deze cases zijn interessant omdat ze inzicht geven in hoe multistar-systemen ontstaan ​​en evolueren.

Friedman was net klaar met zijn eerste jaar als hoofdvak computerwetenschappen aan de Universiteit van Michigan, en, aan het begin van de zomer, had geen achtergrond in de astronomie, high-performance computergebruik, gegevenswetenschap, of machinaal leren. Samenvattend de complexiteit van de taak bij de hand, Friedman liep vanwege COVID-19 zijn stage vanuit huis, maar ondanks deze uitdagingen, Powell zei dat hij het snel doorhad.

"Hij is ronduit briljant, " zei Powell. "Adam heeft een griezelig vermogen om afwijkingen van periodiciteit in lichtcurven te zien." Met zo'n kosmisch diepgaand resultaat van zijn stage, het is gemakkelijk om het verloop van Friedmans vooruitgang te vergeten. "Het is niet alsof hij aan het begin van de zomer een astronoom en machine learning-expert was, " voegde hij eraan toe. "Zijn vermogen om extreem complexe concepten en vaardigheden in zo'n korte tijd onder de knie te krijgen, is verbazingwekkend."

Friedman was dankbaar voor zijn tijd bij Powell in de zomer. Hij zei:"Ik moet Brian enorm veel eer geven. Hij was een ongelooflijke mentor; hij was absoluut de beste supervisor die ik ooit heb ontmoet. Hij ontmoette me elke dag, gewoon om me te leren hoe ik het project moet doen. Hij was echt een geweldige leraar."