science >> Wetenschap >  >> Elektronica

Studie gebruikt neurale netwerken om dada . te definiëren

Tien pagina's uit Dada-tijdschriften die door het neurale netwerk als "Dada" zijn geclassificeerd. Krediet:Cornell University

Om een ​​dadaïstisch gedicht te maken, kunstenaar Tristan Tzara zei ooit:knip elk woord uit een krantenartikel. Doe de woorden in een zak en schud. Haal de woorden één voor één uit de zak, en schrijf ze in die volgorde op.

Deze "zak met woorden"-methode verschilt niet helemaal van hoe kunstmatige intelligentie-algoritmen woorden en afbeeldingen identificeren, door ze stap voor stap op te splitsen in componenten. De gelijkenis inspireerde Cornell-onderzoekers om te onderzoeken of een algoritme kon worden getraind om gedigitaliseerde dadaïstische tijdschriften te onderscheiden van niet-dada avant-garde tijdschriften - een formidabele taak, gezien het feit dat velen Dada als inherent ondefinieerbaar beschouwen.

Maar het algoritme - een convolutief neuraal netwerk dat doorgaans wordt gebruikt om veelvoorkomende afbeeldingen te identificeren - presteerde beter dan willekeurig. Het identificeerde in 63 procent van de tijd pagina's van Dada-journalen en in 86 procent van de tijd niet-Dada-pagina's.

"Ons doel is niet per se om het 'juiste' antwoord te krijgen, maar eerder om de berekening te gebruiken om een ​​buitenaards wezen te leveren, onbekend perspectief, " schreven de onderzoekers in "Computational Cut-Ups:The Influence of Dada, " die gepubliceerd in de Tijdschrift voor moderne periodieke studies in januari. "Kan een hulpmiddel dat is ontworpen om honden te identificeren, opnieuw worden gebruikt voor het verkennen van de avant-garde?"

Ze probeerden ook een voorbeeld te geven van hoe grote verzamelingen afbeeldingen kunnen worden geanalyseerd, zei Laure Thompson, een doctoraatsstudent in de informatica, die samen met David Mimno het artikel schreef, assistent-hoogleraar informatica.

Text mining - het doorzoeken van grote hoeveelheden gedigitaliseerde tekst op bepaalde woorden of zinsdelen - wordt veel gebruikt in de digitale geesteswetenschappen, maar het zoeken naar afbeeldingen is veel moeilijker.

"Tekst heeft zeer handige functies - ze staan ​​bekend als woorden. En we kunnen ze heel snel zien vanwege de spaties ertussen, ', zei Thompson. 'Terwijl een afbeelding naar een computer slechts een grote matrix van getallen is, en dat staat bekend als niet erg zinvol."

Thompson en Mimno trainden hun neurale netwerk op dadaïstische tijdschriften uit het digitale Blue Mountain-archief van Princeton University. Zonder ook maar iets te weten over Dada – een avant-garde beweging die na de Eerste Wereldoorlog in Europa ontstond en die materialisme en conventies omver wilde werpen – probeerde het algoritme vervolgens rond 33 te classificeren, 000 tijdschriftpagina's als Dada of niet-Dada.

Het netwerk leert afbeeldingen te identificeren via steeds complexere lagen - vroege lagen kunnen eenvoudige structuren zoals randen of rechte hoeken herkennen, terwijl de laatste laag zal proberen de afbeelding te labelen als, zeggen, een herdershond.

In dit onderzoek, het model analyseerde de voorlaatste laag, die een reeks cijfers omvatte in plaats van labels zoals 'herdershond'. Mimno en Thompson noemden deze numerieke lagen "computational cut-ups, een knipoog naar het dadaïstische 'bag of words'-concept.

Het algoritme "kan bijna de antithese zijn van kunst, maar het speelt ook met al deze methodieken die in Dada zelf verschenen, ' zei Thompson.

Hoewel ze niet wisten hoe het algoritme zijn beslissingen nam, de onderzoekers werkten achteruit van de resultaten. Ze ontdekten dat het netwerk Dada associeerde met de kleur rood, hoog contrast en prominente randen. Het had de neiging om pagina's met realistische afbeeldingen en foto's te classificeren als niet-Dada, ze vonden.

Van de andere genres die het algoritme analyseerde, het vaakst identificeerde het kubisme ten onrechte als dada - wat logisch was voor de onderzoekers, aangezien het kubisme de dada-kunst sterk beïnvloedde.

Voordat we het dada-experiment uitvoeren, de onderzoekers testten hun concept op pagina's met muziek. Het algoritme identificeerde 67 procent van de 3, 450 pagina's met partituren als "muziek, " en 96 procent van de 55, 007 pagina's zonder muziek als "geen muziek". Ze ontdekten dat het model de neiging had om pagina's te classificeren met nette, horizontale tafels als muziek, en pagina's met kleur of afbeeldingen als 'geen muziek'.

"Als je gevoelens op deze modellen wilt projecteren, ze zijn behoorlijk lui, "zei Thompson. Bijvoorbeeld, onderzoekers hebben ontdekt dat als je een model traint om afbeeldingen van vissen te identificeren, en alle geleverde afbeeldingen tonen mensen die vissen vasthouden, het zal waarschijnlijk alle afbeeldingen classificeren met mensen die dingen vasthouden als vissen.

De classificaties van het model werpen enig licht op welke kenmerken Dada kunnen definiëren, zeiden de onderzoekers, ook al is het idee om een ​​machine te gebruiken om kunst te bekijken simplistisch en mogelijk absurd.

"Dit is deels een ironische poging. We proberen niet superserieus te zijn, dat deze classifier alle kunsthistorici zal verslaan bij het identificeren van wat Dada Dada echt maakt, Thompson zei. "Het model weet niets over Dada, maar het kan nog steeds helpen om een ​​extra perspectief te bieden om erover na te denken."