science >> Wetenschap >  >> Elektronica

Nieuwe big data-algoritmen verbeteren de detectie van aardbevingen; toezicht houden op de gezondheid van vee en plagen in de landbouw

Krediet:CC0 Publiek Domein

Twee nieuwe algoritmen kunnen ervoor zorgen dat vroegtijdige waarschuwingssystemen voor aardbevingen je een paar extra seconden geven om te vallen, Hoes, en houd vol voordat de grond begint te trillen.

Computerwetenschappers aan de Universiteit van Californië, Riverside heeft twee algoritmen ontwikkeld die de monitoring van aardbevingen verbeteren en boeren helpen hun gewassen te beschermen tegen gevaarlijke insecten. of controleer de gezondheid van kippen en andere dieren. De algoritmen ontdekken snel patronen in enorme datasets, met minder rekenkracht en lagere kosten, dan andere methoden en zijn gebruikt om de detectie van aardbevingen te verbeteren, bewaak het insect vector Aziatische citrus psyllid, en het voedingsgedrag van kippen te evalueren.

Grote gegevens, grote problemen

Sensoren, zoals seismische sensoren, die automatisch gebeurtenissen registreren die herhaaldelijk plaatsvinden gedurende een bepaalde periode, een probleem hebben. Ze verzamelen zoveel gegevens dat het moeilijk is om patronen te herkennen. Tijdreeksanalyse lost dit op door te zoeken naar andere voorbeelden van een steekproefreeks binnen een dataset, meestal met behulp van grafische verwerkingseenheden, of GPU's. Maar voor zeer grote datasets wordt dit onpraktisch omdat het te veel GPU's vereist, wat de kosten verhoogt.

Zacharias Zimmerman, een doctoraatsstudent in computerwetenschappen aan het Marlan and Rosemary Bourns College of Engineering, gebouwd op een algoritme dat eerder is ontwikkeld door co-auteur en hoogleraar informatica Eamonn Keogh om extreem grote datasets te verwerken en het op 40 GPU's te draaien die worden gehost op de Amazon Web Services-cloud.

Het algoritme, genaamd SCAMP, sorteerde bijna twee jaar seismische opnamen van de Californische Parkfield Fault, een deel van de San Andreas-breuk in de buurt van de stad Parkfield, in slechts 10 uur, tegen een redelijke prijs van ongeveer $ 300, en ontdekte 16 keer meer aardbevingen dan eerder bekend waren.

"Het is moeilijk om genoeg te benadrukken hoe schaalbaar dit algoritme is, " zei Keogh. "Om dit aan te tonen, we hebben een triljoen - dat is 1 gevolgd door 18 nullen - paarsgewijze vergelijkingen gemaakt van fragmenten van aardbevingsgegevens. Niets anders in de literatuur komt binnen een tiende van een procent van die grootte."

Het identificeren van aardbevingen is niet altijd gemakkelijk

"Het meest fundamentele probleem in de seismologie is het identificeren van aardbevingen. Er zijn een aantal methodologische verbeteringen geweest door seismologen die strategieën uit de informatica toepassen om naar vergelijkbare patronen te zoeken, " zei co-auteur Gareth Funning, een universitair hoofddocent seismologie. "De grote vooruitgang hier is dat de dataset die je kunt beheren heel veel groter. Als we naar seismische gegevens keken, dachten we dat we het goed deden door alles in een tijdsbestek van twee maanden te vergelijken."

Andere methoden voor het detecteren van aardbevingen vereisen dat het algoritme reeksen vindt die overeenkomen met een bekende aardbeving. De UC Riverside-methode vergelijkt in plaats daarvan alles binnen een bepaalde tijd en kan dus aardbevingen identificeren die niet noodzakelijk overeenkomen met een gegeven als een model.

Bijvoorbeeld, hun analyse van de Parkfield-gegevens ontdekte subtiel, laagfrequente aardbevingen onder de San Andreas-breuk. Opeenvolgingen van deze aardbevingen, ook bekend als niet-vulkanische trillingen, begeleiden diep, langzame bewegingen van tektonische platen.

Vlotten van laagfrequente aardbevingen zijn af en toe voorafgegaan aan massale aardbevingen, zoals die in Japan 10 jaar geleden. Een betere detectie van laagfrequente aardbevingen zou kunnen helpen de voorspellingen van de grootste aardbevingen te verbeteren en wetenschappers ook helpen de bewegingen van tektonische platen beter te volgen.

Van aardbevingen tot kippen en insectenplagen

Het SCAMP-algoritme kan ook schadelijk landbouwongedierte detecteren. Keogh bevestigde sensoren die de bewegingen van insecten registreerden terwijl ze sappen uit bladeren zogen en het algoritme gebruikten om Aziatische citrusbladvlo te identificeren, het insect dat verantwoordelijk is voor het verwoesten van citrusgewassen door de bacteriën te verspreiden die Huanglongbing veroorzaken, of citrusgroenziekte. Hij gebruikte het algoritme ook om een ​​dataset van versnellingsmeters te analyseren, die verschillende soorten bewegingen meten, gehecht aan kippen gedurende een periode van dagen. SCAMP identificeerde vervolgens specifieke patronen met betrekking tot voeding en ander gedrag.

SCAMP heeft één beperking, echter.

"SCAMP vereist dat je de hele tijdreeks hebt voordat je gaat zoeken. In het geval van het ontginnen van historische seismologische gegevens, wij hebben dat. Of in een wetenschappelijke studie, we kunnen de kip 10 uur laten rondlopen en de gegevens achteraf analyseren, " zei co-auteur Philip Brisk, een universitair hoofddocent informatica en doctoraal adviseur van Zimmerman. "Maar met datastreaming direct vanaf de sensor, we willen geen 10 uur wachten. We willen kunnen zeggen dat er nu iets aan de hand is."

Snellere realtime aardbevingsdetectie

Zimmerman gebruikte de miljard datapunten, een matrixprofiel genoemd, gegenereerd door SCAMP's analyse van de Parkfield-foutgegevens om een ​​algoritme te trainen dat hij LAMP noemde. LAMP vergelijkt de streaminggegevens met voorbeelden die het eerder heeft gezien om de meest relevante gegevens te selecteren die van de sensor komen.

"Als je het matrixprofiel bij de sensor tot je beschikking hebt, weet je meteen wat belangrijk is en wat niet. Je kunt al je controles in realtime doen omdat je alleen maar door de belangrijke stukjes kijkt, ', aldus Zimmermann.

De mogelijkheid om seismische gegevens sneller te interpreteren, zou de reeds bestaande aardbevingswaarschuwingssystemen kunnen verbeteren.

"Met een vroege waarschuwing voor aardbevingen, je probeert dingen op bewakingsstations te detecteren en de informatie vervolgens door te sturen naar een centraal systeem dat evalueert of het een grote aardbeving is of niet, "zei Funning. "Een opstelling als deze zou potentieel veel van dat discriminatiewerk kunnen doen voordat het naar het systeem wordt verzonden. Je zou tijd kunnen besparen op de berekening die nodig is om te bepalen dat er een schadelijke gebeurtenis aan de gang is, mensen een paar extra seconden geven om te stoppen, Hoes, en hou vol."

"Een paar seconden is enorm in een vroege waarschuwing voor aardbevingen, " hij voegde toe.

De krant over SCAMP, "Matrix Profile XIV:schalen van Time Series Motif Discovery met GPU's om een ​​quintillion paarsgewijze vergelijkingen per dag en daarna te doorbreken, " werd gepresenteerd op het ACM Symposium over Cloud Computing van 20-23 november, 2019 in Santa Cruz. Auteurs zijn Zachary Zimmerman, Kave Kamgar, Nader Shakibay Senobari, Brian Crites, Gareth Funning, Philip Brisk en Eamonn Keogh.

De krant over LAMP, "Matrix Profile XVIII:Time Series Mining in het licht van snel bewegende streams met behulp van een geleerd benaderingsmatrixprofiel, " werd eerder in november gepresenteerd op de IEEE International Conference on Data Mining 2019 in Beijing. De auteurs zijn Zachary Zimmerman, Nader Shakibay Senobari, Gareth Funning, Evangelos Papalexakis, Samet Oymak, Philip Brisk, en Eamonn Keogh.