Wetenschap
Vijf representatieve steekproeven voor elke klasse (rij) in de CIFAR-10-dataset. Voor elke klas, deze monsters zijn verkregen met generatieve modellen die zijn getraind nadat ze 40% van de afbeeldingen van die specifieke klasse uit de trainingsset hebben laten vallen. Krediet:IBM
Als je een kind wilt leren hoe een olifant eruit ziet, je hebt een oneindig aantal opties. Maak een foto van National Geographic, een knuffeldier van Dombo, of een olifant sleutelhanger; laat het aan het kind zien; en de volgende keer dat hij een object ziet dat op een olifant lijkt, zal hij waarschijnlijk wijzen en het woord zeggen.
AI leren hoe een olifant eruit ziet, is een beetje anders. Om een machine learning-algoritme te trainen, je hebt waarschijnlijk duizenden afbeeldingen van olifanten nodig met verschillende perspectieven, zoals hoofd, staart, en profiel. Maar dan, zelfs na het innemen van duizenden foto's, als je je algoritme verbindt met een camera en het een sleutelhanger van een roze olifant laat zien, het zal het waarschijnlijk niet herkennen als een olifant.
Dit is een vorm van databias, en het heeft vaak een negatieve invloed op de nauwkeurigheid van classificaties voor diep leren. Om dit vooroordeel op te lossen, hetzelfde voorbeeld gebruikend, we zouden minstens 50-100 afbeeldingen van roze olifanten nodig hebben, wat problematisch zou kunnen zijn, aangezien roze olifanten "zeldzaam" zijn.
Dit is een bekende uitdaging in machine learning-gemeenschappen, en of het nu roze olifanten zijn of verkeersborden, kleine datasets vormen grote uitdagingen voor AI-wetenschappers.
Balans herstellen voor het trainen van AI
Sinds begin dit jaar is mijn collega's en ik bij IBM Research in Zürich bieden een oplossing. Het heet BAGAN, of het balanceren van generatieve vijandige netwerken, en het kan volledig nieuwe beelden genereren, d.w.z. van roze olifanten, om de balans te herstellen voor het trainen van AI.
Vijf representatieve steekproeven gegenereerd voor de drie meest vertegenwoordigde meerderheidsklassen in de GT-SRB-dataset. Krediet:IBM
Zien is geloven
In de krant rapporteren we met behulp van BAGAN op de Duitse Traffic Sign Recognition Benchmark, evenals op MNIST en CIFAR-10, en in vergelijking met state-of-the-art GAN, de methodologie presteert beter dan ze allemaal in termen van variëteit en kwaliteit van de gegenereerde afbeeldingen wanneer de trainingsdataset onevenwichtig is. Beurtelings, dit leidt tot een hogere nauwkeurigheid van de uiteindelijke classifiers die zijn getraind op de uitgebreide dataset.
Vijf representatieve steekproeven gegenereerd voor de drie minst vertegenwoordigde minderheidsklassen in de GT-SRB-dataset. Krediet:IBM
Dit verhaal is opnieuw gepubliceerd met dank aan IBM Research. Lees hier het originele verhaal.
Wetenschap © https://nl.scienceaq.com