science >> Wetenschap >  >> Elektronica

PizzaGAN krijgt de foto over hoe je een pizza maakt

Is niets heilig? Wie zou zelfs durven te praten over een machine-learning experiment dat resulteert in de perfecte (hijg)pizza? Het is moeilijk om na te denken, maar een onderzoekskwintet schuwde het niet om het te proberen, en ze werkten om een ​​machine te leren hoe ze een geweldige taart konden maken.

Zeg hallo tegen PizzaGAN, een op compositie gebaseerd generatief model dat was bedoeld om de stapsgewijze procedure van het maken van pizza's te weerspiegelen.

Hun doel was om de machine te leren door een generatief model te bouwen dat een geordende reeks instructies weerspiegelt. Hoe ze te werk gingen:"Elke operator is ontworpen als een Generative Adversarial Network (GAN). Gezien slechts een zwak toezicht op beeldniveau, de operators zijn getraind om een ​​visuele laag te genereren die moet worden toegevoegd aan of verwijderd uit het bestaande beeld. Het voorgestelde model is in staat om een ​​afbeelding te ontleden in een geordende reeks lagen door achtereenvolgens in de juiste volgorde de bijbehorende verwijdermodules toe te passen."

(Generatieve vijandige netwerken kunnen veel doen, Victoria Song merkte op in Gizmodo . Ze zei dat het "in feite het type machine learning was dat werd gebruikt om realistische AI-gezichten en deepfakes te genereren.")

Resultaten? Het volstaat te zeggen dat ze meldden dat ze een model naar tevredenheid hadden gemaakt. "Experimentele resultaten op synthetische en echte pizzabeelden tonen aan dat ons voorgestelde model in staat is om:(1) pizzatoppings te segmenteren op een zwak gecontroleerde manier, (2) verwijder ze door te onthullen wat zich eronder bevindt (d.w.z. inschilderen), en (3) de volgorde van de toppings afleiden zonder toezicht op de dieptebestelling."

Het team sprak over hun synthetische en echte pizzadatasets.

"Pizza is het meest gefotografeerde eten op Instagram met meer dan 38 miljoen berichten met de hashtag #pizza, " zeiden ze. Ze downloadden een half miljoen afbeeldingen van Instagram met behulp van verschillende populaire pizza-gerelateerde hashtags. Ze filterden ongewenste afbeeldingen uit met behulp van een op CNN gebaseerde classifier die was getraind op een reeks handmatig gelabelde pizza / niet-pizza-afbeeldingen.

Ze verzamelden labels op afbeeldingsniveau voor de pizza-toppings op Amazon Mechanical Turk (AMT) voor 9, 213 pizza-afbeeldingen.

Voor hun synthetische pizzadataset, ze gebruikten pizza-afbeeldingen in clip-art-stijl. "Er zijn twee belangrijke voordelen van het maken van een dataset met synthetische pizza's. Ten eerste, het stelt ons in staat om een ​​willekeurig grote set pizza-voorbeelden te genereren zonder menselijke annotatiekosten. Ten tweede en belangrijker, we hebben toegang tot nauwkeurige informatie over de grondwaarheid en meerlaagse pixelsegmentatie van de toppings."

Dus, in het grotere geheel, welke bijdrage hebben zij geleverd, indien van toepassing, aan de mensheid? Victoria Song maakte een punt, toen ze schreef, "Op lange termijn, je kunt je voorstellen dat een neuraal netwerk een foto kan scannen en een vrij nauwkeurig recept kan uitspugen op basis van ingrediënten, hoe grondig het is gekookt, en zelfs nauwelijks zichtbare kruiden."

Na alles is gezegd (en gedaan), "het onderzoek demonstreert meestal alleen maar het vermogen van een AI om onderscheid te maken tussen een verwarrende stapel ingrediënten." Dat wisten ze toen ze zich op pizza gingen richten. Denk aan een "archetypisch voorbeeld" van iets dat de opeenvolgende toevoeging van ingrediënten in een specifieke volgorde nodig heeft.

In het grotere geheel, pizza is niet het enige item dat hun aanpak zou kunnen gebruiken. "Hoewel we ons model alleen hebben geëvalueerd in de context van pizza, wij zijn van mening dat een vergelijkbare aanpak veelbelovend is voor andere soorten voedsel die van nature gelaagd zijn, zoals hamburgers, boterhammen, en salades."

Voor meer informatie over hun onderzoek, hun papier is getiteld, "Hoe maak je een pizza:een op compositie gebaseerd GAN-model leren, " door Dim Papadopoulos, Youssef Tamaazousti, Ferda Ofli, Ingmar Weber en Antonio Torralba. De krant staat op arXiv. De paper werd eerder deze maand ingediend.

© 2019 Wetenschap X Netwerk