science >> Wetenschap > >> Elektronica

Het evenwicht herstellen in datasets voor machine learning

Vijf representatieve steekproeven voor elke klasse (rij) in de CIFAR-10-dataset. Voor elke klas, deze monsters zijn verkregen met generatieve modellen die zijn getraind nadat ze 40% van de afbeeldingen van die specifieke klasse uit de trainingsset hebben laten vallen. Krediet:IBM

Als je een kind wilt leren hoe een olifant eruit ziet, je hebt een oneindig aantal opties. Maak een foto van National Geographic, een knuffeldier van Dombo, of een olifant sleutelhanger; laat het aan het kind zien; en de volgende keer dat hij een object ziet dat op een olifant lijkt, zal hij waarschijnlijk wijzen en het woord zeggen.

AI leren hoe een olifant eruit ziet, is een beetje anders. Om een machine learning-algoritme te trainen, je hebt waarschijnlijk duizenden afbeeldingen van olifanten nodig met verschillende perspectieven, zoals hoofd, staart, en profiel. Maar dan, zelfs na het innemen van duizenden foto's, als je je algoritme verbindt met een camera en het een sleutelhanger van een roze olifant laat zien, het zal het waarschijnlijk niet herkennen als een olifant.

Dit is een vorm van databias, en het heeft vaak een negatieve invloed op de nauwkeurigheid van classificaties voor diep leren. Om dit vooroordeel op te lossen, hetzelfde voorbeeld gebruikend, we zouden minstens 50-100 afbeeldingen van roze olifanten nodig hebben, wat problematisch zou kunnen zijn, aangezien roze olifanten "zeldzaam" zijn.

Dit is een bekende uitdaging in machine learning-gemeenschappen, en of het nu roze olifanten zijn of verkeersborden, kleine datasets vormen grote uitdagingen voor AI-wetenschappers.

Balans herstellen voor het trainen van AI

Sinds begin dit jaar is mijn collega's en ik bij IBM Research in Zürich bieden een oplossing. Het heet BAGAN, of het balanceren van generatieve vijandige netwerken, en het kan volledig nieuwe beelden genereren, d.w.z. van roze olifanten, om de balans te herstellen voor het trainen van AI.

Vijf representatieve steekproeven gegenereerd voor de drie meest vertegenwoordigde meerderheidsklassen in de GT-SRB-dataset. Krediet:IBM

Zien is geloven

In de krant rapporteren we met behulp van BAGAN op de Duitse Traffic Sign Recognition Benchmark, evenals op MNIST en CIFAR-10, en in vergelijking met state-of-the-art GAN, de methodologie presteert beter dan ze allemaal in termen van variëteit en kwaliteit van de gegenereerde afbeeldingen wanneer de trainingsdataset onevenwichtig is. Beurtelings, dit leidt tot een hogere nauwkeurigheid van de uiteindelijke classifiers die zijn getraind op de uitgebreide dataset.

Vijf representatieve steekproeven gegenereerd voor de drie minst vertegenwoordigde minderheidsklassen in de GT-SRB-dataset. Krediet:IBM

Dit verhaal is opnieuw gepubliceerd met dank aan IBM Research. Lees hier het originele verhaal.

Contactloze 3D-vingerafdrukidentificatie

Een streng wachtwoordbeleid helpt fraude te voorkomen, studie vondsten

Hoofdlijnen

Wetenschap

Elektronica
Biologie
Zonsverduistering
Wiskunde
French | Italian | Spanish | Portuguese | Swedish | German | Dutch | Danish | Norway |