science >> Wetenschap >  >> Elektronica

AI-tool karakteriseert een liedjesgenre en biedt inzichten met betrekking tot perceptiemuziek

Krediet:CC0 Publiek Domein

Het record van Lil Nas X, hit "Old Town Road" is inderdaad country. Maar het is ook een beetje rock 'n roll. En als je de teksten en akkoorden samen analyseert, het is pure pop.

Minstens, dat is volgens een tool voor kunstmatige intelligentie ontwikkeld door USC informatica Ph.D. student Timothy Greer. De methode van Greer voorspelt automatisch muziekgenres door te analyseren hoe songteksten en akkoorden met elkaar omgaan tijdens het nummer.

De methode classificeerde "Old Town Road" als land volgens de tekst; rock volgens de akkoorden (gebaseerd op een muziekvoorbeeld van Nine Inch Nails); en pop volgens de gecombineerde akkoorden en teksten.

De krant, getiteld "Gedeelde vectorrepresentaties van woorden en akkoorden in muziek gebruiken voor genreclassificatie, " zal worden gepresenteerd tijdens de toespraak, Music and Mind 2019-conferentie op 14 september.

Een zeer menselijke ervaring

"Old Town Road is een interessant nummer, " zei Greer, een levenslange muzikant die momenteel saxafoon en keyboard speelt in een band uit LA (muziekgenre:indierock).

"De teksten zijn doordrenkt van het countrygenre, maar de akkoorden en de instrumentatie klinken helemaal niet als country. Het algoritme benadrukt de complexiteit van muziek, zowel in termen van hoe de muziek is geconstrueerd en hoe het wordt waargenomen, met andere woorden, hoe mensen het verwerken."

Deze inspanning in muziekonderzoek - om de verhalen die we ermee vertellen computationeel te begrijpen, en hoe mensen het ervaren en erdoor worden beïnvloed - maakt deel uit van een groter onderzoeksprogramma in Computational Media Intelligence bij USC Signal Analysis and Interpretation Laboratory (SAIL) (SAIL).

"Muziekconstructie en perceptie zijn gerelateerd, maar ze zijn niet één en hetzelfde, " zei Greer's supervisor en co-auteur van het papier Shrikanth Narayanan.

Narayan, SAIL-directeur en de Niki en Max Nikias-leerstoel en hoogleraar Electrical and Computer Engineering, heeft eerder vocale patronen van beatboxers en operazangers geanalyseerd met behulp van MRI-scans, voorspelde geweldsclassificaties met behulp van filmscripts en ontwikkelde technologie die stem gebruikt om de emoties van sprekers te beoordelen. Hij zei enthousiast te zijn over dit nieuwe onderzoek, omdat het een nieuwe manier is om muziek computationeel te analyseren en onverwachte patronen aan het licht kan brengen.

"We zeggen altijd dat er geen vaste regel is voor menselijke ervaringen met muziek, " zei Narayanan, een liefhebber van klassieke muziek die het Indiase snaarinstrument veena en de viool bespeelt. "AI en machine learning kunnen een lens bieden om naar deze zeer menselijke ervaring te kijken."

Een nieuw geluid

"Oude Stadsweg, " die nu 18 weken bovenaan de hitparade staat, is bekend om zijn genre-mengen kenmerk. Als een van de meest besproken onderwerpen in de popwereld deze zomer, iedereen lijkt een andere mening te hebben - is het land, knal, steen? Of iets heel anders?

In april 2019, het nummer werd verwijderd uit de Billboard Hot Country-hitlijst omdat het "niet genoeg elementen van de hedendaagse countrymuziek omarmde om in de huidige versie in kaart te brengen, " volgens een Billboard-verklaring.

Greer testte het nummer met drie modellen die hij had ontwikkeld om het genre te voorspellen:met alleen akkoordinbeddingen, alleen lyrische inbeddingen en het gebruik van akkoord-en-lyrische inbeddingen gecombineerd. Hij trainde het systeem op een dataset met 190, 165 muzikale segmenten van 5, 304 popsongs met teksten en bijbehorende akkoorden.

Hoewel de meeste tools voor het voorspellen van genres het volledige audiobestand van een nummer gebruiken, wat betekent het ophalen en verwerken van een opname van hoge kwaliteit, De methode van Greer kan genres classificeren met alleen akkoorden en songteksten, die meestal online beschikbaar zijn met een snelle Google-zoekopdracht.

"Deze wisselwerking tussen akkoordsequenties en songtekstsequenties kan ons een beter inzicht geven in hoe we genres waarnemen dan wanneer we een van beide alleen gebruiken, hoewel beide modaliteiten alleen nuttige informatie bevatten, ook, ' zei Greer.

De studie geeft een beter inzicht in hoe we muziek waarnemen en verwerken, met name de verschillen in menselijke muziekperceptie en categorisering van muziekgenre, afhankelijk van het gebruikte "kijkglas".

Toepassingen zijn onder meer hoe muziekinhoud op de markt wordt gebracht, geconsumeerd en gelabeld; neuropsychologie en de mechanismen van het menselijk denken; en affectieve computersystemen die invloed hebben op menselijke emoties.