Wetenschap
Voorbeeldframes van Moviescope-videotrailers die de diversiteit in de voorgestelde dataset laten zien. Krediet:Sitaraman et al.
Een team van onderzoekers van de Universiteit van Virginia heeft onlangs een grootschalige analyse uitgevoerd om functies in filmtrailers te identificeren die het genre en het geschatte budget van een film het beste voorspellen. In hun studie hebben geschetst in een paper dat vooraf is gepubliceerd op arXiv, vergeleken de onderzoekers specifiek de effectiviteit van visuele, geluid, tekst, en op metadata gebaseerde functies.
"Video-begrip is de volgende grens na beeldbegrip, Vicente Ordónez, een van de onderzoekers die het onderzoek heeft uitgevoerd, vertelde TechXplore . "Echter, veel werk aan het begrijpen van video's heeft zich tot nu toe geconcentreerd op korte clips waarin een mens een enkele actie uitvoert. We wilden iets langer, maar er is ook de kwestie van rekenkracht. Videotrailers leken een tussencompromis, omdat ze een veelvoud van dingen tentoonstellen, van eng tot grappig."
Filmtrailers zijn kort en kunnen gemakkelijk worden gecombineerd met filmbeschrijvingen. Ordonez en zijn collega's realiseerden zich dat deze eigenschappen hen ideaal maken om parallellen tussen video en taal te onderzoeken.
In aanvulling, recente studies hebben verschillende veelbelovende tools geïntroduceerd voor het analyseren van afbeeldingen in combinatie met tekstbeschrijvingen. De onderzoekers waren nieuwsgierig om enkele van deze technieken te evalueren op videoherkenningstaken.
aanvankelijk, toen ze gevestigde methoden probeerden toe te passen voor het analyseren van korte videoclips op filmtrailers, de resultaten waren teleurstellend. Dus besloten ze een diepgaand onderzoek uit te voeren om de functies te identificeren die het meest effectief zijn voor het analyseren van filmtrailers.
"We ontdekten dat het combineren van alle modaliteiten (d.w.z. video, tekst, audio en metagegevens), we hebben waardevolle inzichten kunnen verzamelen over verwachte correlaties tussen specifieke genres en een bepaalde modaliteit, bijvoorbeeld, dat visuele kenmerken waardevoller zijn bij het voorspellen van een film als geanimeerd of niet, "Paola Cascante Bonilla, een andere onderzoeker die bij het onderzoek betrokken was, vertelde TechXplore. "Bovendien, we ontdekten dat het opnemen van de audio in onze experimenten de prestaties van de genrevoorspelling aanzienlijk verbetert in vergelijking met alleen het gebruik van de video, tekst en metagegevens."
De onderzoekers merkten op dat het analyseren van filmposters tot onbevredigende resultaten leidde, gericht op alle filmkenmerken die in een trailer worden gepresenteerd (d.w.z. video, tekst, audio en metadata) leidden tot aanzienlijke verbeteringen. Deze bevindingen zijn bijzonder opmerkelijk, omdat ze zouden kunnen helpen om effectievere instrumenten te ontwikkelen om films te analyseren en als basis kunnen dienen voor toekomstige onderzoeksstudies.
interessant, bij het focussen op video, tekst- en audiogegevens uit trailers, Ordónez, Cascante-Bonilla en hun collega's waren in staat om het genre van een film te schatten met een nauwkeurigheid die vergelijkbaar is met de metadata van de film (d.w.z. informatie over de acteurs, regisseur, enzovoort.). De technieken die de onderzoekers in hun onderzoek gebruikten, die verschillende kenmerken/modaliteiten combineren, zou daarom kunnen worden gebruikt om een breder scala aan films te analyseren.
In hun studie hebben het team introduceerde ook een nieuwe dataset voor trainings- en evaluatietools om films te analyseren. Deze gegevensset, genaamd Moviescope, omvat 5, 000 films, samen met de bijbehorende trailers, filmposters, filmplots en bijbehorende metadata.
"Onze bevindingen suggereren dat alleen de tekstuele samenvatting van een film niet genoeg is om onderscheid te maken tussen een animatiefilm en een film van een ander genre, " zei Shiva Sivaraman, een andere onderzoeker die bij het onderzoek betrokken is en nu bij Microsoft werkt. "Je moet de trailer 'zien' om te kunnen beslissen of een bepaalde film geanimeerd is of niet. De modale aandachtstechniek die we hebben gebruikt, stelt ons in staat om de kenmerken te identificeren en te analyseren waar het model meer aandacht aan besteedt bij het voorspellen van een bepaald genre. Zoals we voorspelden, het model leert de visuele functie af te wegen tegen andere functies terwijl het voorspellingen doet voor het animatiegenre."
De bevindingen die door dit team van onderzoekers zijn verzameld, kunnen belangrijke implicaties hebben voor zowel de analyse van films als voor filmreclame. In de toekomst, andere onderzoeksgroepen zouden deze observaties kunnen gebruiken om effectievere tools te ontwikkelen voor het voorspellen van specifieke aspecten van films. In aanvulling, de technieken die door de Ordonez en zijn collega's worden gebruikt, kunnen de reclame-industrie informeren over het maken van meer impactvolle trailers.
"We zijn nu van plan filmplots en posters te gebruiken om de manier waarop films worden geadverteerd te analyseren en aanbevelingen te doen over het maximaliseren van de effectiviteit van filmreclame, zowel vanuit het perspectief van consumenten als distributeurs, ' zei Ordónez.
© 2019 Wetenschap X Netwerk
Wetenschap © https://nl.scienceaq.com