Science >> Wetenschap >  >> Astronomie

Wat kan AI leren over het universum?

Illustratie van een actieve quasar. Nieuw onderzoek toont aan dat AI ze kan identificeren en classificeren. Krediet:ESO/M. Kornmesser

Kunstmatige intelligentie en machinaal leren zijn alomtegenwoordig geworden, met toepassingen variërend van data-analyse, cyberbeveiliging, farmaceutische ontwikkeling, muziekcompositie en artistieke weergaven.



De afgelopen jaren zijn er ook grote taalmodellen (LLM's) opgekomen, waardoor menselijke interactie en schrijven aan de lange lijst met toepassingen zijn toegevoegd. Dit geldt ook voor ChatGPT, een LLM die een grote impact heeft gehad sinds de introductie minder dan twee jaar geleden. Deze toepassing heeft tot veel discussie (en controverse) geleid over de potentiële toepassingen en implicaties van AI.

Ook de astronomie heeft er enorm van geprofiteerd, waarbij machinaal leren wordt gebruikt om enorme hoeveelheden gegevens te doorzoeken om te zoeken naar tekenen van planetaire transits, om atmosferische interferentie te corrigeren en om patronen in de ruis te vinden. Volgens een internationaal team van astrofysici is dit misschien nog maar het begin van wat AI voor de astronomie kan betekenen.

In een recente studie heeft het team een ​​Generative Pre-trained Transformer (GPT)-model verfijnd met behulp van observaties van astronomische objecten. Daarbij hebben ze met succes aangetoond dat GPT-modellen effectief kunnen helpen bij wetenschappelijk onderzoek.

De studie werd uitgevoerd door het International Center for Relativistic Astrophysics Network (ICRANet), een internationaal consortium bestaande uit onderzoekers van het International Center for Relativistic Astrophysics (ICRA), het National Institute for Astrophysics (INAF), de University of Science and Technology van China, het Chinese Academie van Wetenschappen Instituut voor Hoge Energie Fysica (CAS-IHEP), de Universiteit van Padua, de Isfahan Universiteit voor Technologie en de Universiteit van Ferrera.

Hun paper, "Can AI Understand Our Universe? Test of Fine-Tuning GPT by Astrophysical Data", werd onlangs op de arXiv geplaatst. preprint-server.

Zoals gezegd vertrouwen astronomen in grote mate op machine learning-algoritmen om de hoeveelheden gegevens te doorzoeken die door moderne telescopen en instrumenten zijn verkregen. Deze praktijk begon ongeveer tien jaar geleden en is sindsdien met grote sprongen gegroeid tot het punt waarop AI in het hele onderzoeksproces is geïntegreerd. Zoals ICRA-voorzitter en hoofdauteur van het onderzoek, Yu Wang, via e-mail aan Universe Today vertelde:

“Astronomie is altijd gedreven geweest door data en astronomen behoren tot de eerste wetenschappers die machinaal leren adopteren en gebruiken. Nu is machinaal leren geïntegreerd in het hele astronomische onderzoeksproces, van de productie en controle van op de grond en in de ruimte gebaseerde telescopen (bijv. het optimaliseren van de prestaties van adaptieve optische systemen, het verbeteren van de initiatie van specifieke acties (triggers) van satellieten onder bepaalde omstandigheden, enz.), tot data-analyse (bijv. ruisonderdrukking, data-imputatie, classificatie, simulatie, enz.) , en het opzetten en valideren van theoretische modellen (bijvoorbeeld het testen van gewijzigde zwaartekracht, het beperken van de toestandsvergelijking van neutronensterren, enz.)."

Gegevensanalyse blijft de meest voorkomende van deze toepassingen, omdat dit het gemakkelijkste gebied is waarop machinaal leren kan worden geïntegreerd. Traditioneel analyseerden tientallen onderzoekers en honderden burgerwetenschappers de hoeveelheden gegevens die door een observatiecampagne werden geproduceerd.

Dit is echter niet praktisch in een tijd waarin moderne telescopen dagelijks terabytes aan gegevens verzamelen. Dit omvat onder meer onderzoeken aan de hele hemel, zoals de Very Large Array Sky Survey (VLASS) en de vele fasen die worden uitgevoerd door de Sloan Digital Sky Survey (SDSS).

Tot op heden zijn LLM's slechts sporadisch toegepast op astronomisch onderzoek, aangezien ze een relatief recente creatie zijn. Maar volgens voorstanders als Wang heeft het een enorme maatschappelijke impact gehad en heeft het een ondergrenspotentieel dat equivalent is aan een ‘industriële revolutie’.

Wat de bovengrens betreft, voorspelt Wang dat deze aanzienlijk kan variëren en misschien kan resulteren in de 'verlichting of vernietiging' van de mensheid. In tegenstelling tot de Industriële Revolutie ligt het tempo van verandering en integratie echter veel hoger voor AI, wat vragen oproept over hoe ver de adoptie ervan zal gaan.

Om het potentieel ervan voor het gebied van de astronomie te bepalen, zeiden Wang, namen hij en zijn collega's een vooraf getraind GPT-model over en verfijnden het om astronomische verschijnselen te identificeren:

"OpenAI biedt vooraf getrainde modellen, en wat we hebben gedaan is het verfijnen, wat inhoudt dat we een aantal parameters wijzigen op basis van het originele model, waardoor het astronomische gegevens kan herkennen en resultaten op basis van deze gegevens kan berekenen. Dit lijkt een beetje op het feit dat OpenAI ons een bachelorstudent, die we vervolgens hebben opgeleid tot masterstudent astronomie.

"We hebben beperkte gegevens met een bescheiden resolutie geleverd en de GPT minder vaak getraind in vergelijking met normale modellen. Niettemin zijn de resultaten indrukwekkend en bereiken we een nauwkeurigheid van ongeveer 90%. Dit hoge nauwkeurigheidsniveau is toe te schrijven aan de robuuste basis van de GPT, die begrijpt al gegevensverwerking en beschikt over logische gevolgtrekkingen, evenals communicatieve vaardigheden."

Om hun model te verfijnen, introduceerde het team waarnemingen van verschillende astronomische verschijnselen, afgeleid uit verschillende catalogi. Dit omvatte 2.000 monsters van quasars, sterrenstelsels, sterren en quasars met een brede absorptielijn (BAL) uit de SDSS (elk 500). Ze integreerden ook observaties van korte en lange gammastraaluitbarstingen (GRB's), sterrenstelsels, sterren en simulaties van zwarte gaten. Bij tests heeft hun model met succes verschillende fenomenen geclassificeerd, onderscheid gemaakt tussen soorten quasars, de afstand afgeleid op basis van roodverschuiving, en de rotatie en inclinatie van zwarte gaten gemeten.

"Dit werk toont in ieder geval aan dat LLM's astronomische gegevens kunnen verwerken", zegt Wang. "Bovendien is het vermogen van een model om verschillende soorten astronomische gegevens te verwerken een vermogen dat andere gespecialiseerde modellen niet bezitten. We hopen dat LLM's verschillende soorten gegevens kunnen integreren en vervolgens gemeenschappelijke onderliggende principes kunnen identificeren om ons te helpen de wereld te begrijpen. Natuurlijk , dit is een uitdagende taak en niet een die astronomen alleen kunnen volbrengen."

Uiteraard erkent het team dat de dataset waarmee ze experimenteerden erg klein was vergeleken met de dataoutput van moderne observatoria. Dit geldt met name voor faciliteiten van de volgende generatie, zoals het Vera C. Rubin Observatorium, dat onlangs zijn LSST-camera heeft ontvangen, de grootste digitale camera ter wereld!

Zodra Rubin operationeel is, zal het de 10-jarige Legacy Survey of Space and Time (LSST) uitvoeren, die naar verwachting 15 terabytes aan gegevens per nacht zal opleveren! Om aan de eisen van toekomstige campagnes te voldoen, zegt Wang, zijn verbeteringen en samenwerking tussen observatoria en professionele AI-bedrijven nodig.

Niettemin is het een uitgemaakte zaak dat er in de nabije toekomst meer LLM-aanvragen voor astronomie zullen zijn. Dit is niet alleen een waarschijnlijke ontwikkeling, maar ook noodzakelijk gezien de enorme hoeveelheid gegevens die astronomische studies tegenwoordig genereren. En aangezien dit in de nabije toekomst waarschijnlijk exponentieel zal toenemen, zal AI waarschijnlijk onmisbaar worden in het vakgebied.

Meer informatie: Yu Wang et al., Kan AI ons universum begrijpen? Test van het afstemmen van GPT op basis van astrofysische gegevens, arXiv (2024). DOI:10.48550/arxiv.2404.10019

Journaalinformatie: arXiv

Aangeboden door Universe Today