Wetenschap
Een jonge zonachtige ster omringd door zijn planeetvormende schijf van gas en stof. Krediet:NASA/JPL-Caltech
Als onderdeel van een poging om verre planeten te identificeren die gastvrij zijn voor leven, NASA heeft een crowdsourcingproject opgezet waarbij vrijwilligers telescopische beelden doorzoeken op sporen van puinschijven rond sterren, die goede indicatoren zijn voor exoplaneten.
Met behulp van de resultaten van dat project, onderzoekers van MIT hebben nu een machine-leersysteem getraind om zelf naar puinschijven te zoeken. De schaal van het zoeken vereist automatisering:er zijn bijna 750 miljoen mogelijke lichtbronnen in de gegevens die zijn verzameld door NASA's Wide-Field Infrared Survey Explorer (WISE) -missie alleen.
Bij testen, het machine-learningsysteem was het in 97 procent van de gevallen eens met menselijke identificaties van puinschijven. De onderzoekers hebben hun systeem ook getraind om puinschijven te beoordelen op basis van hun waarschijnlijkheid dat ze detecteerbare exoplaneten bevatten. In een paper waarin het nieuwe werk in het tijdschrift wordt beschreven Astronomie en informatica , de MIT-onderzoekers melden dat hun systeem 367 voorheen niet-onderzochte hemellichamen identificeerde als bijzonder veelbelovende kandidaten voor verder onderzoek.
Het werk vertegenwoordigt een ongebruikelijke benadering van machine learning, die is verdedigd door een van de co-auteurs van het papier, Victor Pankratius, een hoofdonderzoeker bij MIT's Haystack Observatory. Typisch, een machine-learningsysteem doorzoekt een schat aan trainingsgegevens, op zoek naar consistente correlaties tussen kenmerken van de gegevens en een label dat door een menselijke analist is aangebracht - in dit geval sterren omringd door puinschijven.
Maar Pankratius stelt dat in de wetenschappen, machine learning-systemen zouden nuttiger zijn als ze expliciet een beetje wetenschappelijk begrip zouden bevatten, om te helpen bij het zoeken naar correlaties of om afwijkingen van de norm te identificeren die van wetenschappelijk belang kunnen zijn.
"De belangrijkste visie is om verder te gaan dan waar AI zich vandaag op richt, " zegt Pankratius. "Vandaag, we verzamelen gegevens, en we proberen functies in de gegevens te vinden. Je eindigt met miljarden en miljarden functies. Dus wat doe je met ze? Wat je als wetenschapper wilt weten, is niet dat de computer je vertelt dat bepaalde pixels bepaalde eigenschappen zijn. Je wilt weten 'Oh, dit is een fysiek relevant ding, en hier zijn de fysieke parameters van het ding.'"
Klassikaal concept
Het nieuwe artikel kwam voort uit een MIT-seminar dat Pankratius samen met Sara Seager gaf, de klasse van 1941 hoogleraar aarde, Sfeervol, en Planetaire Wetenschappen, die bekend staat om haar onderzoek naar exoplaneten. Het seminarie, Astroinformatica voor exoplaneten, studenten kennis laten maken met datawetenschapstechnieken die nuttig kunnen zijn voor het interpreteren van de stroom aan gegevens die door nieuwe astronomische instrumenten worden gegenereerd. Na het beheersen van de technieken, de studenten werd gevraagd om ze toe te passen op openstaande astronomische vragen.
Voor haar afstudeerproject Tam Nguyen, een afgestudeerde student in de luchtvaart en ruimtevaart, koos voor het probleem van het trainen van een machine-leersysteem om puinschijven te identificeren, en het nieuwe papier is een uitvloeisel van dat werk. Nguyen is eerste auteur op het papier, en ze wordt vergezeld door Seager, Pankratius, en Laura Eckman, een bachelor met als hoofdvak elektrotechniek en informatica.
Van het NASA crowdsourcing-project, de onderzoekers hadden de hemelcoördinaten van de lichtbronnen waarvan menselijke vrijwilligers hadden vastgesteld dat ze puinschijven bevatten. De schijven zijn herkenbaar als ellipsen van licht met in het midden iets helderdere ellipsen. De onderzoekers gebruikten ook de ruwe astronomische gegevens die door de WISE-missie werden gegenereerd.
Om de gegevens voor te bereiden op het machine learning-systeem, Nguyen sneed het in kleine stukjes, gebruikte vervolgens standaard signaalverwerkingstechnieken om artefacten uit te filteren die werden veroorzaakt door de beeldvormende instrumenten of door omgevingslicht. Volgende, ze identificeerde die brokken met lichtbronnen in hun midden, en gebruikte bestaande beeldsegmentatie-algoritmen om eventuele extra lichtbronnen te verwijderen. Dit soort procedures is typerend voor elk computer-vision machine learning-project.
Gecodeerde intuïties
Maar Nguyen gebruikte basisprincipes van de natuurkunde om de gegevens verder te snoeien. Voor een ding, ze keek naar de variatie in de intensiteit van het licht dat door de lichtbronnen wordt uitgestraald over vier verschillende frequentiebanden. Ze gebruikte ook standaardstatistieken om de positie te evalueren, symmetrie, en schaal van de lichtbronnen, het vaststellen van drempels voor opname in haar dataset.
Naast de getagde puinschijven van NASA's crowdsourcingproject, de onderzoekers hadden ook een korte lijst met sterren waarvan astronomen hadden vastgesteld dat ze waarschijnlijk exoplaneten herbergen. Uit die informatie, hun systeem leidde ook tot kenmerken van puinschijven die gecorreleerd waren met de aanwezigheid van exoplaneten, om de 367 kandidaten voor verdere studie te selecteren.
"Gezien de schaalbaarheidsuitdagingen met big data, het gebruik van crowdsourcing en burgerwetenschap om trainingsdatasets te ontwikkelen voor machine-learning classifiers voor astronomische observaties en bijbehorende objecten is een innovatieve manier om uitdagingen aan te gaan, niet alleen in de astronomie, maar ook in verschillende data-intensieve wetenschapsgebieden, " zegt Dan Crichton, die het Center for Data Science and Technology leidt in het Jet Propulsion Laboratory van NAASA. "Het gebruik van de computerondersteunde ontdekkingspijplijn die wordt beschreven om de extractie te automatiseren, classificatie, en validatieproces zal nuttig zijn om te systematiseren hoe deze mogelijkheden kunnen worden samengebracht. De paper doet goed werk door de effectiviteit van deze benadering te bespreken, zoals toegepast op kandidaten voor puinschijven. De geleerde lessen zullen belangrijk zijn voor het generaliseren van de technieken naar andere astronomie en andere disciplines."
"Het wetenschappelijke team van Disk Detective heeft gewerkt aan zijn eigen machine-learningproject, en nu deze krant uit is, we zullen bij elkaar moeten komen en aantekeningen moeten vergelijken, " zegt Marc Kuchner, een senior astrofysicus bij NASA's Goddard Space Flight Center en leider van het crowdsourcing-schijfdetectieproject dat bekend staat als Disk Detective. "Ik ben erg blij dat Nguyen dit onderzoekt, want ik denk echt dat dit soort machine-menselijke samenwerking cruciaal zal zijn voor het analyseren van de grote datasets van de toekomst."
Dit verhaal is opnieuw gepubliceerd met dank aan MIT News (web.mit.edu/newsoffice/), een populaire site met nieuws over MIT-onderzoek, innovatie en onderwijs.
Wetenschap © https://nl.scienceaq.com