Wetenschap
Tweestapsmodelarchitectuur:de eerste stap voert woorddetectie uit op basis van Faster R-CNN. De tweede stap voert woordherkenning uit met behulp van een volledig convolutiemodel met CTC-verlies. De twee modellen worden onafhankelijk van elkaar getraind. Krediet:Facebook
Wanneer een meme meer dan goofy is en de grens overschrijdt om ronduit beledigend te zijn, let er iemand op de winkel?
Zeg hallo tegen Rosetta, dat is een machine learning-systeem dat is ontworpen om te zeggen whoa. Facebook heeft dit machine learning-systeem gebouwd en geïmplementeerd. "Het haalt tekst uit meer dan een miljard openbare Facebook- en Instagram-afbeeldingen en videoframes (in een grote verscheidenheid aan talen), dagelijks en in realtime, en voert het in een tekstherkenningsmodel in dat is getraind in classificaties om de context van de tekst en de afbeelding samen te begrijpen."
Herkenning van haatspraak via automatische technologie is nooit gemakkelijk en het wordt met de tijd moeilijker. Rosetta kan de last van het proberen verlichten om ervoor te zorgen dat het niet onopgemerkt naar buiten glijdt. Rosetta is een systeem dat de context van tekst en afbeelding kan bepalen samen .
Wat betekent dat? Woorden begrijpen, afbeeldingen begrijpen...maar nu tekst begrijpen in afbeeldingen?
Posten op de "Facebook Code"-site, Viswanath Sivakumar, Albert Gordo, en Manohar Paluri, beschrijf de uitdagingen die een oplossing als Rosetta wenken. Ten slotte, creatievelingen gaan verder dan traditionele artikelen die op tekst zijn gericht.
Ze zeiden dat een "aanzienlijk aantal van de foto's die op Facebook en Instagram worden gedeeld, tekst in verschillende vormen bevatten. Het kan over een afbeelding in een meme worden gelegd, of ingelegd in een foto van een winkelpui, straat bord, of restaurantmenu. Rekening houdend met het enorme aantal foto's dat elke dag op Facebook en Instagram wordt gedeeld, het aantal talen dat wordt ondersteund op ons wereldwijde platform, en de variaties van de tekst, het probleem van het begrijpen van tekst in afbeeldingen is heel anders dan het probleem dat wordt opgelost door traditionele optische tekenherkenning (OCR)-systemen, die de personages herkennen, maar de context van de bijbehorende afbeelding niet begrijpen."
OKE, AI, kunnen we over memes praten? Onze gesprekken hebben meerdere specerijen. Met Facebook, afbeeldingen met tekst worden elke dag gepost, inclusief memes. Rosetta is ontworpen (1) om schermlezers een manier te geven om te lezen wat erop staat (2) om ervoor te zorgen dat ze geen haatdragende taal bevatten of het inhoudsbeleid van de website schenden,
Snel bedrijf wees erop dat het systeem meestal is toegepast op stilstaande beelden, maar Rosetta krijgt gewoon natte voeten; dit gaat dieper in. "Facebook is van plan om Rosetta steeds vaker in te zetten om de betekenis van tekst uit video te halen in al zijn applicaties, " ook al is de technologie nog niet klaar om alle video's aan te pakken.
interessant, Snel bedrijf Daniel Terdiman zag dit als een wapen tegen memes, omdat er behoefte was aan effectieve tools waarop services kunnen vertrouwen, om memes uit te roeien die schadelijk kunnen zijn, in inhoud die anders onder de radar zou kunnen vliegen. "We houden allemaal van memes, en de meesten van ons hebben ze waarschijnlijk helpen verspreiden - die schattige foto met de ironische tekst hebben doorgegeven aan onze vele vrienden op Facebook, Twitter, en elders. Maar soms kunnen memes schadelijk zijn, het verspreiden van onwaarheden over mensen of organisaties."
Eenvoudigweg, het Rosetta-systeem kan het beter doen dan voorheen mogelijk was "in het begrijpen van schadelijke of valse tekst die wordt gebruikt in memes die zich over Facebook en Instagram verspreiden."
Mariella Moon binnen Engadget besproken hoe het werkt, en "het begint met het detecteren van rechthoekige gebieden in afbeeldingen die mogelijk tekst bevatten. Het gebruikt vervolgens een convolutioneel neuraal netwerk om te herkennen en te transcriberen wat er in dat gebied is geschreven, zelfs niet-Engelse woorden of niet-Latijnse alfabetten, " zei Moon. Om het systeem te trainen, voegde ze eraan toe, Facebook gebruikte "een mix van door mensen en machines geannoteerde openbare afbeeldingen."
Wat is de status van Rosetta op dit moment? Jacob Kastrenakes, De rand :"Rosetta zou nu live zijn, het extraheren van tekst uit 1 miljard afbeeldingen en videoframes per dag op zowel Facebook als Instagram."
Wat is het volgende? Rosetta is niet perfect; Facebook wil dichter bij perfectie komen, en heeft een to-do lijst. Moon zei dat het bedrijf van plan is om het aantal talen dat het kan begrijpen te blijven uitbreiden en "het beter te maken in het extraheren van tekst uit videoframes."
Heeft iemand het gevoel dat er misschien mensen zijn die Rosetta een slechte blik zullen sturen naarmate het bekender wordt? Kan zijn. Cohen Coberly in TechSpot schreef, "Rosetta zal vrijwel zeker een controversieel hulpmiddel zijn voor bepaalde leden van het meme-liefhebbende publiek, maar ik hoop dat de technologie slim genoeg zal zijn om onderscheid te maken tussen onnozele maar ongevaarlijke inhoud en echt aanstootgevende beelden."
Kastrenakes, De rand :"Gezien de bekende moderatieproblemen van het bedrijf, een goed werkend systeem dat potentieel problematische afbeeldingen automatisch kan markeren, zou een echte hulp kunnen zijn."
© 2018 Tech Xplore
Wetenschap © https://nl.scienceaq.com