Wetenschap
De dynamische rekenmodellen van Xiangliang kunnen tweets analyseren om de interesses van Twitter-gebruikers te identificeren. Krediet:KAUST
Je posts op sociale media onthullen veel over jou. KAUST-onderzoekers hebben een dynamisch rekenmodel ontwikkeld dat tweets kan analyseren om de interesses van Twitter-gebruikers te identificeren en veranderingen in de loop van de tijd te volgen. "Als we de evolutie van de interesses van gebruikers begrijpen, kunnen we ze dienovereenkomstig groeperen en vrienden aanbevelen, nieuws, evenementen en andere diensten, ", zegt Xiangliang Zhang, die het onderzoek bij KAUST leidde.
Het creëren van computermodellen die de veranderende interesses van een persoon kunnen identificeren op basis van hun posts op sociale media is een veelzijdig probleem. De eerste uitdaging is om de betekenis van de geplaatste tekst te begrijpen, een onderzoeksgebied dat bekend staat als Natural Language Processing (NLP). "Het doel van NLP is om computers net zo intelligent te maken als mensen in het begrijpen van taal, " zegt Zhang. "Het is een van de meest uitdagende taken van AI, " zij voegt toe.
Op regels gebaseerde NLP-modellen zijn niet erg succesvol geweest in het interpreteren van de nuance van taal in de manier waarop mensen woorden op diverse en creatieve manieren gebruiken, zodat de betekenis van woorden vaak sterk afhankelijk kan zijn van de context. Een alternatieve benadering is om machine learning toe te passen om woorden in een semantische ruimte weer te geven, waar semantisch verwante woorden bijvoorbeeld, Parijs, Peking en Riyad - worden nauw samen in kaart gebracht.
Om de interesses van Twitter-gebruikers te identificeren door hun tweets te analyseren, de belangrijkste uitdaging is om individuele gebruikers te karakteriseren aan de hand van hun belangrijkste trefwoorden. Zhang en haar team hebben een inbeddingsmodel gemaakt waarin woorden en gebruikers samen worden behandeld. "We hebben een dynamisch gebruikers- en woordinbeddingsmodel gemaakt dat gezamenlijk en dynamisch gebruikers- en woordrepresentaties in dezelfde semantische ruimte kan leren, "zegt Zhang.
De onderzoekers verbeterden de output van het model door een streaming-component voor diversificatie van zoekwoorden te ontwikkelen en op te nemen, die nauw verwante zoekwoorden kan identificeren en overbodige vermeldingen uit de bovenste zoekwoordenlijst kan verwijderen. Het resulterende model kan een breed scala aan interesses voor elke gebruiker vastleggen en zich in de loop van de tijd aanpassen aan hun veranderende interesses.
Toen het team hun model testte op een reeks tweets, het was een aanzienlijke verbetering ten opzichte van eerdere benaderingen, zegt Zhang. "Ons model presteert aanzienlijk beter dan veel geavanceerde modellen voor gebruikersprofilering." Het team heeft al een nieuwe iteratie van hun inbeddingsmodelaanpak geproduceerd, zij voegt toe, waarin gebruikersrelaties ook worden vastgelegd om te beginnen met het identificeren van interesses die gebruikers gemeen hebben. "Het volgende model zal geavanceerder zijn en dynamische co-inbeddingsvectoren bouwen die tegelijkertijd de sociale nabijheid van de gebruiker en de gebruiker en de relevantie van het gebruikersattribuut vastleggen, "zegt Zhang.
Wetenschap © https://nl.scienceaq.com