Wetenschap
Krediet:Pixabay/CC0 publiek domein
Onderzoek gepubliceerd in het International Journal of Cloud Computing kijkt naar hoe machine learning ons in staat zou kunnen stellen de aard en kenmerken van updates van sociale media te analyseren en te detecteren welke van die updates koren op de geruchtenmolen zijn in plaats van feitelijk te zijn.
Nepnieuws is bij ons sinds de eerste roddels destijds een gerucht de ronde deden. Maar met de komst van sociale media is het nu zoveel gemakkelijker om nepnieuws, desinformatie en propaganda te verspreiden onder een groot wereldwijd publiek met weinig beperkingen. Een gerucht kan een reputatie maken of breken. Tegenwoordig kan dat over de hele wereld gebeuren via de versterkende echokamer van sociale media.
Mohammed Al-Sarem, Muna Al-Harby, Faisal Saeed en Essa Abdullah Hezzam van de Taibah University in Medina, Saoedi-Arabië hebben de verschillende benaderingen voor tekstvoorverwerking onderzocht voor het benaderen van de enorme hoeveelheden gegevens die dagelijks uit sociale media stromen . Hoe goed deze benaderingen werken in de daaropvolgende analyse van geruchtendetectie, is van cruciaal belang voor hoe goed nepnieuws kan worden opgemerkt en gestopt. Het team heeft verschillende benaderingen getest op een dataset van politiek nieuwsgerelateerde tweets uit Saoedi-Arabië.
Pre-processing kan kijken naar de drie meest relevante kenmerken van een update voordat de tekstanalyse wordt uitgevoerd en de verschillende updates dienovereenkomstig opsplitsen:Ten eerste kan het kijken naar het gebruik van vraag- en uitroeptekens en het aantal woorden. Ten tweede kan het kijken of een account is geverifieerd of eigenschappen heeft die vaker worden geassocieerd met een nep- of bot-account, zoals het aantal tweets, antwoorden, retweets, enz. Ten derde kan het kijken naar op gebruikers gebaseerde functies, zoals de gebruiker naam en het logo of de profielfoto van de gebruiker.
De onderzoekers ontdekten dat pre-processing de analyse aanzienlijk kan verbeteren wanneer de output wordt toegevoerd aan een van de support vector machine (SVM), multinomial naïeve Bayes (MNB) en K-nearest buur (KNN) classifiers. Deze classifiers reageren echter verschillend, afhankelijk van de combinatie van voorbewerkingstechnieken die wordt gebruikt. Bijvoorbeeld het verwijderen van stopwoorden en het opschonen van codeertags, zoals HTML, stammen en tokenisatie. + Verder verkennen
Wetenschap © https://nl.scienceaq.com