Wetenschap
Tegoed:CC0 Publiek Domein
Volwassen of pornografische inhoudspam is een groeiend probleem op sociale media. Nieuw onderzoek in het International Journal of Business Intelligence and Data Mining bespreekt hoe dergelijke inhoud snel kan worden gedetecteerd en tijdig kan worden verwijderd.
Deepali Dhaka, Surbhi Kakar en Monica Mehrotra van Jamia Millia Islamia (Central University) in Jamia Nagar, New Delhi, India, leggen uit hoe de algemene gebruikerservaring en die van jongere mensen die sociale media gebruiken, kan worden verbeterd als obscene spam-inhoud kan worden gefilterd effectief en snel. Machine learning-tools zijn vaak de beste manier om bepaalde soorten inhoud te detecteren en het team heeft aangetoond dat een dergelijke tool, XGboost, spam-inhoud voor volwassenen kan detecteren met een nauwkeurigheid van meer dan 90%. Dit was het meest effectieve classificatie-algoritme van de zes die door het team zijn getest en aangepast voor het detecteren van pornografische spam op Twitter.
Als zodanig zouden minder dan tien op de honderd updates die als spam voor volwassenen zijn gemarkeerd, valse positieven zijn. De aanpak van het team moest slechts een klein aantal functies, het waardesysteem, de entropie van woorden, lexicale diversiteit en woordinbedding analyseren, om volwassen spam-updates te kunnen plukken uit de algemene stroom van updates op een van de meest bekende sociale mediaplatforms, Twitter.
Inherent aan positieve detectie is dat gewone gebruikers van het platform over het algemeen een breed scala aan onderwerpen in verschillende contexten bespreken en schrijven en delen op wat een organische manier zou kunnen worden genoemd. Daarentegen hebben spammers en pornografische spammers in dit geval een vaste of zelfs volledig geautomatiseerde benadering van hun updates, een beperkte diversiteit aan onderwerpen, zoals je zou verwachten, en een zeer beperkt lexicon. Deze en andere kenmerken van spamberichten maken ze herkenbaar voor het algoritme. + Verder verkennen
Wetenschap © https://nl.scienceaq.com