science >> Wetenschap >  >> Elektronica

Het leesgedrag van boeken op Goodreads analyseren om Amazon Bestsellers te voorspellen

Statuspagina voor "End of Watch (Bill Hodges Trilogy #3) van Stephen King". Krediet:Maity, Panigrahi &Mukherjee.

Onderzoekers van de Northwestern University, Microsoft Onderzoek India, en het Indian Institute of Technology Kharagpur hebben onlangs een model ontwikkeld om te voorspellen of een boek binnen 15 dagen na publicatie een bestseller op Amazon zal worden. hun voorbeeld, beschreven in een studie die vooraf is gepubliceerd op arXiv, werkt door het analyseren van leesgedrag op het online platform Goodreads.

"We hebben gewerkt aan het analyseren van de populariteitsdynamiek van verschillende sociale media-entiteiten, zoals hashtags op Twitter, onderwerpen in Quora enz." Animesh Mukherjee, vertelde een van de onderzoekers die het onderzoek uitvoerden aan TechXplore. "We waren van mening dat een vergelijkbare benadering zou kunnen worden gevolgd om de populariteit van boeken te analyseren en we vonden Goodreads ideaal voor dit onderzoek."

De populariteit van een boek hangt af van een groot aantal factoren en kan worden gemeten aan de hand van verschillende parameters. In hun studie hebben de onderzoekers concentreerden zich op hoe leeskenmerken van boeken de populariteit ervan beïnvloeden. Ze voerden een platformonafhankelijke analyse uit van Goodreads-entiteiten en probeerden deze te koppelen aan het verkoopvolume van boeken op Amazon.

"We volgden de intuïtie dat de populariteit van boeken vooral wordt aangedreven door de lezers, vandaar de motivatie om leesgedrag van boeken te extraheren om de toekomstige populariteit van boeken te begrijpen, "Zei Mukherjee. "Een van de beste manieren om de populariteit van boeken te kwantificeren, is door naar het verkooprecord te kijken. Dus, we hebben geprobeerd het begrip populariteit te kwantificeren in termen van Amazon-bestsellers."

Beginnen met, de onderzoekers analyseerden het collectieve leesgedrag van gebruikers op Goodreads. Vervolgens kwantificeerden ze verschillende karakteristieke kenmerken van Goodreads-entiteiten, die kunnen worden gebruikt om verschillen tussen Amazon-bestsellers en andere minder verkochte boeken te identificeren. Eindelijk, ze ontwikkelden een op machine learning gebaseerd model dat deze karakteristieke eigenschappen gebruikt om te voorspellen of een boek 15 dagen na publicatie een bestseller zal worden.

"We gebruikten state-of-the-art machine learning-modellen om onze voorspellingen uit te voeren, "Mukherjee legde uit. "We hebben geconstateerd dat de beoordelingen en recensies die een boek op Goodreads ontvangt, niet zo effectief zijn in het voorspellen van bestsellers als de leesstatus-postpatronen van de gebruikers. Bijvoorbeeld, in Goodreads, een lezer kan posten hoeveel van het boek is gelezen, op welke pagina hij/zij staat, kunnen commentaar geven op het boek enz. We vinden dat deze functies zeer effectief zijn om te voorspellen of het boek in de toekomst een bestseller zal worden."

Kenmerkende eigenschappen van statusberichten van Goodreads-gebruikers:distributie van a) aantal statusupdates per gebruiker b) aantal unieke gebruikers dat status bijwerkt c) aantal gebruikers dat meerdere keren wordt bijgewerkt d) aankomsttijd tussen statussen e) gemiddelde maximale leestijd f ) gemiddelde tijd om te lezen voor ABS versus andere boeken. Krediet:Maity, Panigrahi &Mukherjee.

Hun model behaalde een veelbelovende gemiddelde nauwkeurigheid van 88,72 procent bij het voorspellen van boeken die een paar weken na hun publicatie Amazon-bestsellers zouden worden. hun methode, die was gebaseerd op functies die zijn afgeleid van gebruikersberichten en genre-gerelateerde eigenschappen, bereikte een verbetering van 16,4 procent in vergelijking met baseline-methoden die alleen traditionele populariteitsfactoren gebruiken, zoals boekbeoordelingen of recensies.

"Een van de belangrijkste inzichten die we uit deze studie verkrijgen, is dat de Amazon-bestsellerboeken niet noodzakelijkerwijs worden gekwalificeerd door de recensietekst van hoge kwaliteit van de lezers of een hoog aantal beoordelingen, " zei Mukherjee. "In tegenstelling, een grote meerderheid van hen heeft postpatronen van lezersstatus die hen sterk onderscheiden van de rest van de boeken."

De onderzoekers evalueerden ook hoe goed hun methode twee andere soorten boeken kon voorspellen:hoog gewaardeerde boeken die een groot aantal recensies ontvangen maar geen bestsellers zijn (HRHR), en Goodreads Choice Award-genomineerde (GCAN) boeken die geen bestsellers zijn. Ze behaalden een hoge gemiddelde nauwkeurigheid van 87,1 procent voor GCAN en van 86,22 procent voor HRHR-boeken.

"Wij zijn van mening dat dit werk een belangrijke bijdrage levert aan de huidige literatuur, omdat het niet alleen het collectieve leesgedrag van een sociaal boekleesplatform ontvouwt door middel van een rigoureuze meetstudie, maar ook een sterke link legt tussen twee orthogonale kanalen - Goodreads en Amazon, ' zei Mukherjee.

Het door Mukherjee en zijn collega's ontwikkelde model zou de ontwikkeling van tools kunnen bevorderen die Amazon en Goodreads overbruggen via nieuwe platformonafhankelijke beleidsontwerpen. Ze zijn van mening dat dergelijke interacties een van de redenen kunnen zijn voor de overname van Goodreads door Amazon in maart 2013. De onderzoekers willen hun onderzoek nu uitbreiden door het leesgedrag van gebruikers verder te analyseren.

"Er zijn verschillende richtingen die we in de toekomst willen verkennen, "Mukherjee zei. "Een daarvan is om de populariteit van verschillende genres boeken te onderzoeken, bijvoorbeeld, wat zijn de statuspostpatronen in verschillende boekengenres? Een andere is het bestuderen van de interdynamiek van genre- en lezersdemografie. Bijvoorbeeld, hoe verschilt het leesgedrag van mannen van vrouwen, of hoe verschillen ze tussen verschillende continenten?"

© 2018 Tech Xplore