Wetenschap
Computer vision-experts van Brown University leren computers om contextafhankelijke optische illusies te zien, in de hoop algoritmen voor kunstmatige visie te helpen rekening te houden met de context en robuuster te zijn. Krediet:Serre Lab/Brown University
Is die cirkel groen of grijs? Zijn de hartlijnen recht of gekanteld?
Optische illusies kunnen leuk zijn om te ervaren en te bespreken, maar begrijpen hoe menselijke hersenen deze verschillende fenomenen waarnemen, blijft een actief gebied van wetenschappelijk onderzoek. Voor een klasse van optische illusies, contextuele verschijnselen genoemd, het is bekend dat die percepties afhankelijk zijn van de context. Bijvoorbeeld, de kleur die je denkt dat een centrale cirkel is, hangt af van de kleur van de omringende ring. Soms zorgt de buitenkleur ervoor dat de binnenkleur meer op elkaar lijkt, zoals een aangrenzende groene ring waardoor een blauwe ring turkoois lijkt, maar soms zorgt de buitenste kleur ervoor dat de binnenste kleur minder op elkaar lijkt, zoals een roze ring waardoor een grijze cirkel groenachtig lijkt.
Een team van computer vision-experts van de Brown University ging terug naar af om de neurale mechanismen van deze contextuele verschijnselen te begrijpen. Hun studie werd gepubliceerd op 20 september in Psychologische beoordeling .
"Er is een groeiende consensus dat optische illusies geen bug zijn, maar een kenmerk, " zei Thomas Serre, een universitair hoofddocent cognitieve, linguïstische en psychologische wetenschappen bij Brown en de senior auteur van de krant. "Ik denk dat ze een functie zijn. Ze kunnen randgevallen zijn voor ons visuele systeem, maar onze visie is zo krachtig in het dagelijks leven en in het herkennen van objecten."
Voor de studie, het team onder leiding van Serre, die is aangesloten bij Brown's Carney Institute for Brain Science, begon met een rekenmodel beperkt door anatomische en neurofysiologische gegevens van de visuele cortex. Het model was bedoeld om vast te leggen hoe naburige corticale neuronen berichten naar elkaar sturen en elkaars reacties aanpassen wanneer ze worden gepresenteerd met complexe stimuli zoals contextuele optische illusies.
Een innovatie die het team in hun model opnam, was een specifiek patroon van veronderstelde feedbackverbindingen tussen neuronen, zei Serre. Deze feedbackverbindingen zijn in staat om de respons van een centraal neuron te verhogen of te verlagen, op te wekken of te remmen. afhankelijk van de visuele context.
Deze feedbackverbindingen zijn niet aanwezig in de meeste deep learning-algoritmen. Deep learning is een krachtige vorm van kunstmatige intelligentie die in staat is om complexe patronen in data, zoals het herkennen van afbeeldingen en het ontleden van normale spraak, en is afhankelijk van meerdere lagen kunstmatige neurale netwerken die samenwerken. Echter, de meeste deep learning-algoritmen bevatten alleen feedforward-verbindingen tussen lagen, niet Serre's innovatieve feedbackverbindingen tussen neuronen binnen een laag.
Toen het model eenmaal was gebouwd, het team presenteerde het een verscheidenheid aan contextafhankelijke illusies. De onderzoekers "stemden" de sterkte van de feedback-exciterende of remmende verbindingen af, zodat modelneuronen reageerden op een manier die consistent was met neurofysiologische gegevens van de visuele cortex van primaten.
Daarna testten ze het model op verschillende contextuele illusies en ontdekten opnieuw dat het model de illusies als mensen waarnam.
Om te testen of ze het model nodeloos ingewikkeld hebben gemaakt, ze hebben het model beschadigd - selectief enkele verbindingen verwijderd. Toen het model enkele verbindingen miste, de gegevens kwamen niet zo nauwkeurig overeen met de menselijke perceptiegegevens.
"Ons model is het eenvoudigste model dat zowel noodzakelijk als voldoende is om het gedrag van de visuele cortex te verklaren met betrekking tot contextuele illusies, "Zei Serre. "Dit was echt leerboek computationeel neurowetenschappelijk werk - we begonnen met een model om neurofysiologische gegevens uit te leggen en eindigden met voorspellingen voor menselijke psychofysische gegevens."
Naast het geven van een verenigende verklaring voor hoe mensen een klasse van optische illusies zien, Serre bouwt voort op dit model met als doel het kunstmatige zicht te verbeteren.
State-of-the-art kunstmatige visie-algoritmen, zoals die worden gebruikt om gezichten te taggen of stopborden te herkennen, moeite hebben met het zien van context, hij merkte. Door horizontale verbindingen op te nemen die zijn afgestemd op contextafhankelijke optische illusies, hij hoopt deze zwakte aan te pakken.
Misschien zijn visuele deep learning-programma's die rekening houden met de context moeilijker voor de gek te houden. Een bepaalde sticker, als het vastzit op een stopbord, kan een kunstmatig zichtsysteem denken dat het een snelheidsbord van 65 mijl per uur is, wat gevaarlijk is, zei Serre.
Wetenschap © https://nl.scienceaq.com