science >> Wetenschap >  >> Elektronica

Model combineert sociale media, teledetectiegegevens met als doel nucleaire dreigingen te identificeren

Krediet:CC0 Publiek Domein

Een nieuw rekenmodel stelt onderzoekers in staat om gebruik te maken van normaal onverenigbare datasets, zoals satellietbeelden en posts op sociale media, om vragen te beantwoorden over wat er op de beoogde locaties gebeurt. De onderzoekers ontwikkelden het model om te dienen als hulpmiddel voor het identificeren van schendingen van nucleaire non-proliferatieovereenkomsten.

"Ons doel was om een ​​werkkader te ontwikkelen dat informatie van verschillende sensoren en gegevensbronnen gebruikt om deze potentiële schendingen van nucleaire non-proliferatie te identificeren, " zegt Hamid Krim, co-auteur van een paper over het werk, een professor in elektrische en computertechniek aan de North Carolina State University en directeur van het VISSTA-laboratorium. "Sommige van deze gegevens kunnen conventioneel zijn, zoals Geigerteller-uitlezingen of multispectrale gegevens van satellietbeelden. Maar veel van deze gegevensbronnen kunnen niet-traditioneel zijn, zoals berichten op sociale media. En deze bronnen bieden een grote verscheidenheid aan gegevens die normaal niet compatibel zijn, zoals de tekst op Twitter-berichten en de afbeeldingen op Flickr.

"Door deze verschillende ingangen compatibel met elkaar te maken, we zijn in staat om een ​​breder scala aan gegevensinvoer te accepteren en die gegevens op een zinvolle manier te gebruiken die, uiteindelijk, autoriteiten kunnen helpen om betrouwbaardere conclusies te trekken, ' zegt Krim.

De onderzoekers zeggen dat het model kan worden gebruikt om te werken met alle gegevens die kunnen worden geïdentificeerd als afkomstig uit het beoogde gebied. Bijvoorbeeld, satellietbeelden zijn duidelijk herkenbaar, maar ze kunnen ook gebruikmaken van posts op sociale media die actief of passief zijn getagd als afkomstig uit het betreffende gebied.

De vraag wordt dan:hoe werk je met incompatibele data? Uitleggen, we zullen een proxy-probleem gebruiken dat de onderzoekers in hun paper hebben gebruikt:het identificeren van een overstroming. Ze kozen voor een overstroming omdat gegevens over overstromingen niet geclassificeerd zijn, terwijl gegevens over nucleaire activiteit dat wel zijn.

De eerste stap in het proces is het gebruik van wiskundige vergelijkingen om elk type gegevens in een bruikbaar formaat te vertalen. Bijvoorbeeld, afbeeldingen kunnen door modellen worden gehaald om te bepalen of het afbeeldingen zijn van overstromingen, terwijl tekstberichten door modellen kunnen worden gehaald om te bepalen of ze verwijzingen naar overstromingen bevatten. Als die datastromen eenmaal zijn vertaald in een neutraal formaat – wat betekent dat ze al dan niet overstroming aangeven – kunnen ze met elkaar worden vergeleken om basisvragen te beantwoorden zoals:ondersteunen de data elkaar?

Maar zo eenvoudig is het niet. Bijvoorbeeld, mensen kunnen tweeten over een overstroming die honderden kilometers verderop plaatsvindt, die elke berekening door het overkoepelende model zou kunnen vertekenen. Dit behandelen, de onderzoekers gebruikten wiskundige elementen die de complexiteit verklaren van de gegevens waarop ze putten.

"Het aanpakken van complexiteit is met name belangrijk in de context van de handhaving van non-proliferatie, "Krim zegt. "Relevante gegevensinvoer kan foto's van bepaalde soorten technologie bevatten, verwijzingen gemaakt in gesprekken die zijn vastgelegd op audio, enzovoort. Een model zoals het model dat we hebben ontwikkeld, moet flexibel genoeg zijn om rekening te houden met de variabiliteit en complexiteit van zowel verschillende soorten gegevens als de verschillende aanwijzingen waarnaar we op zoek zijn."

De onderzoekers testten hun model met behulp van gegevens van een overstroming in 2013 die plaatsvond in Colorado, en waren in staat om de incompatibiliteit van multimodale gegevens op te lossen om de locatie van de overstroming nauwkeurig in te schatten.

De volgende stappen van het project omvatten het evalueren van nucleaire faciliteiten in het Westen om gemeenschappelijke kenmerken te identificeren die ook van toepassing kunnen zijn op faciliteiten in meer geïsoleerde samenlevingen, zoals Noord-Korea.

"We willen manieren vinden om informatie van een bekende omgeving naar een verborgen omgeving over te brengen, " zegt Krim. "Hoe kunnen we bepalen welke informatie en welke modellen overdraagbaar zijn van de ene plaats naar de andere, onverenigbare of inconsistente gegevens gegeven? Wat is normaal, en wat niet? Het is geen gemakkelijk probleem."