Wetenschap
Vijf representatieve steekproeven voor elke klasse (rij) in de CIFAR-10-dataset. Voor elke klas, deze monsters zijn verkregen met generatieve modellen die zijn getraind nadat ze 40% van de afbeeldingen van die specifieke klasse uit de trainingsset hebben laten vallen. Krediet:IBM
Als je een kind wilt leren hoe een olifant eruit ziet, je hebt een oneindig aantal opties. Maak een foto van National Geographic, een knuffeldier van Dombo, of een olifant sleutelhanger; laat het aan het kind zien; en de volgende keer dat hij een object ziet dat op een olifant lijkt, zal hij waarschijnlijk wijzen en het woord zeggen.
AI leren hoe een olifant eruit ziet, is een beetje anders. Om een machine learning-algoritme te trainen, je hebt waarschijnlijk duizenden afbeeldingen van olifanten nodig met verschillende perspectieven, zoals hoofd, staart, en profiel. Maar dan, zelfs na het innemen van duizenden foto's, als je je algoritme verbindt met een camera en het een sleutelhanger van een roze olifant laat zien, het zal het waarschijnlijk niet herkennen als een olifant.
Dit is een vorm van databias, en het heeft vaak een negatieve invloed op de nauwkeurigheid van classificaties voor diep leren. Om dit vooroordeel op te lossen, hetzelfde voorbeeld gebruikend, we zouden minstens 50-100 afbeeldingen van roze olifanten nodig hebben, wat problematisch zou kunnen zijn, aangezien roze olifanten "zeldzaam" zijn.
Dit is een bekende uitdaging in machine learning-gemeenschappen, en of het nu roze olifanten zijn of verkeersborden, kleine datasets vormen grote uitdagingen voor AI-wetenschappers.
Balans herstellen voor het trainen van AI
Sinds begin dit jaar is mijn collega's en ik bij IBM Research in Zürich bieden een oplossing. Het heet BAGAN, of het balanceren van generatieve vijandige netwerken, en het kan volledig nieuwe beelden genereren, d.w.z. van roze olifanten, om de balans te herstellen voor het trainen van AI.
Vijf representatieve steekproeven gegenereerd voor de drie meest vertegenwoordigde meerderheidsklassen in de GT-SRB-dataset. Krediet:IBM
Zien is geloven
In de krant rapporteren we met behulp van BAGAN op de Duitse Traffic Sign Recognition Benchmark, evenals op MNIST en CIFAR-10, en in vergelijking met state-of-the-art GAN, de methodologie presteert beter dan ze allemaal in termen van variëteit en kwaliteit van de gegenereerde afbeeldingen wanneer de trainingsdataset onevenwichtig is. Beurtelings, dit leidt tot een hogere nauwkeurigheid van de uiteindelijke classifiers die zijn getraind op de uitgebreide dataset.
Vijf representatieve steekproeven gegenereerd voor de drie minst vertegenwoordigde minderheidsklassen in de GT-SRB-dataset. Krediet:IBM
Dit verhaal is opnieuw gepubliceerd met dank aan IBM Research. Lees hier het originele verhaal.
Een herbruikbare katalysator voor de synthese van esters
Chemicus ontwikkelt nieuwe katalysator voor oxidatie en amidering
Fysische eigenschappen van stikstofgas
Synchrotron-onderzoek onthult de invloed van zuurstof op de chemie van luchtvervuiling
De onderbuik van kreeften is net zo sterk als industrieel rubber
Studie vindt een grote toename van de opname van koolstofdioxide in de oceaan langs het West-Antarctisch Schiereiland
Stijgende verzekeringskosten kunnen Amerikanen ervan overtuigen dat de risico's van klimaatverandering reëel zijn
Dingen die een ecosysteem maken
Oude rotsen geven aanwijzingen voor de vroege geschiedenis van de aarde
Diepe mantelchemie-verrassing:koolstofgehalte niet uniform
Onderzoekers kwantificeren factoren om de weerstand van halfgeleiders met tweederde te verminderen
Voormalig VN-leider bezoekt klimaatadaptatieprojecten in Miami
Magnetische nanodeeltjes zijn veelbelovend in biomedische toepassingen
Hoe het leren van kinderen te bevorderen terwijl ze thuis onderdak bieden?
Stap in mijn auto ... Amazon begint met levering aan voertuigen
Een half procent berekenen op een rekenmachine
Nieuw bewijs dat de kwantumwereld nog vreemder is dan we dachten
Onderzoek naar het terugkeerbeleid van bedrijven biedt richtlijnen voor prijsstelling, geeft terug, terugbetalingen
Wetenschap © https://nl.scienceaq.com