Wetenschap
Boven:Van links naar rechts snapshots van de CME-gebeurtenis die plaatsvond op 16 augustus 2006 16 : 30 UT. Krediet:SOHO LASCO C2. Onder:Van links naar rechts snapshots van de CME-gebeurtenis die plaatsvond op 7 april 1997 14 : 27 UT. Credit:Ruimte:wetenschap en technologie
Coronale massa-ejecties (CME's) zijn eruptieve zonne-evenementen. Ze worden vaak geassocieerd met zonnevlammen en filamenten. CME's kunnen ruimteweergebeurtenissen veroorzaken, zoals geomagnetische stormen, elektronenstormen met hoge energie, injectie van heet plasma, ionosferische stormen en verhoogde dichtheid in de bovenste atmosfeer.
Grote CME-evenementen kunnen van invloed zijn op communicatie, navigatiesystemen, luchtvaartactiviteiten en zelfs elektriciteitsnetten. Om mogelijke schade en verlies van activa te voorkomen, is het nodig om de komst van de CME's nauwkeurig in twee delen te voorspellen. Zal de CME de aarde "raken" of "missen"? Als de voorspelling "hit" is, dan is de volgende vraag wat is de verwachte aankomsttijd van de CME?
In een onderzoekspaper dat onlangs is gepubliceerd in Space:Science &Technology , Yurong Shi van National Space Science Center, Chinese Academie van Wetenschappen, paste het aanbevelingsalgoritme toe, dat kan worden gebruikt om de vergelijkbare historische CME-gebeurtenis voor voorspellers aan te bevelen, om te anticiperen op de aankomsttijd van CME's en bewees dat aanbevelingsalgoritme en logistische regressie samen konden werken om voorspellers een optie te bieden om de voorspellingsresultaten te verbeteren.
Eerst werden de gegevens en de methodologie voorbereid. De auteur selecteerde monsters uit in totaal 30.321 CME-gebeurtenissen die werden verzameld uit de SOHO/LASCO CME-catalogus, van 1996 tot 2020. Oversampling werd gebruikt om de onevenwichtige gegevens op te lossen en heeft 181 positieve monsters verkregen (CME's die de aarde hebben bereikt) en 3486 negatieve monsters (CME's die de aarde niet hebben bereikt).
Bovendien worden 8 karakteristieke parameters verzameld door selectie van karakteristieke parameters, waaronder hoekbreedte, centrale positiehoek (CPA), meetpositiehoek (MPA), lineaire snelheid, beginsnelheid, eindsnelheid, de snelheid bij 20 zonnestralen, massa. Een complete en uniforme dimensieloze dataset van de 8 karakteristieke parameters is opgezet en klaar om de ontwikkeling van het voorspellingsmodel te vergemakkelijken. Om te zoeken naar de historische gebeurtenis die het meest lijkt op de gespecificeerde CME-gebeurtenis, gebruiken de auteurs twee afstanden die vaak worden gebruikt in machine learning en kunstmatige computerintelligentie:cosinusafstand en Euclidische afstand, die beide goed presteerden tijdens het experiment.
Daarna werd het experiment, een gecontroleerde trial, opgezet. De eerste fase is de datasampling. Een totaal van 3.667 monsters inclusief 8 karakteristieke parameters worden willekeurig verdeeld in twee gelijke subgroepen. Een (1.833 monsters) is voor krachttraining en de andere (1.834 monsters) is voor de daaropvolgende aanbevelingstest. Tijdens de gewichtstrainingsfase gebruikte de auteur 1.466 trainingsvoorbeelden die dienden als trainingsset om gewichten te trainen volgens zowel de logistische regressieprocedure als het aanbevelingsalgoritme, terwijl de rest als (367 monsters) de validatieset was.
In het kort worden in totaal 6 experimenten uitgevoerd om gewichten te trainen, en daarom worden 6 sets gewichtscoëfficiënten verkregen met 4 van het logistische regressiealgoritme en 2 van het aanbevelingsalgoritme. Ter vergelijking werden twee logistische regressiekaders gebruikt. Een daarvan was de logit-functie in de op Python gebaseerde statsmodels-module en aangeduid als 'sm.logit'. De andere, ook op Python gebaseerde, was de LogisticRegression-classificator die werd geleverd in de scikit-learn (sklearn) bibliotheek en waarnaar wordt verwezen als "sk.LR."
Als we alle modellen vergelijken, presteerde het sm.logit-model het beste in zowel de validatieset als de testset. Het was passend om de gewichten van sm.logit te kiezen als de optimale gewichten in de volgende fase van dit specifieke werk. Bovendien kan worden gezien dat het gebruik van de aanbevelingsalgoritmen om de gewichten van karakteristieke parameters te trainen erg tijdrovend was, maar het was gemakkelijker om de gewichten te verkrijgen door logistische regressie. Daarom was een nieuwe poging om de gewichten verkregen door de logistische regressie toe te passen op het aanbevelingsalgoritme. De haalbaarheid van een dergelijke operatie werd getest tijdens de laatste fase, de aanbevelingstestfase.
Samenvattend heeft de auteur eerst de gewichten van de karakteristieke parameters van CME's berekend op basis van logistische regressie en deze vervolgens in het aanbevelingsalgoritme ingevoerd om de meest vergelijkbare historische gebeurtenissen te bieden als referentie voor het voorspellen van de effectiviteit van CME's. Het kan worden vastgesteld dat in elke vaardigheidsscore het model dat de gewichten van logistische regressie toepast op het aanbevelingsalgoritme beter was dan het model dat alleen het aanbevelingsalgoritme gebruikte, dus dit hybride model was haalbaar. Een dergelijke behandeling vermeed het trainen van de aanbevelingsgewichten om tijd en computerbronnen te besparen.
Op dit moment is het toepassen van het aanbevelingsalgoritme op de voorspelling van CME's zeer zeldzaam in de literatuur. De auteur bewees dat zodra het logistische regressiemodel de effectiviteit voor een CME bevestigt, het aanbevelingsalgoritme kan worden gebruikt om vergelijkbare historische gebeurtenissen aan te bevelen. Het aanbevelen van soortgelijke historische gebeurtenissen als een levendige referentie voor voorspellers is een grote verbetering van de voorspellingsservice in tegenstelling tot de binaire "ja" of "nee" voorspelling die alleen door het logistische regressiemodel wordt geleverd. Ruimteweervoorspellers kunnen deze methode wellicht gebruiken om een vergelijkende analyse uit te voeren. + Verder verkennen
Wetenschap © https://nl.scienceaq.com