Wetenschap
De Dalí-planeet. Krediet:Het Dalí-museum
Een bezoeker van het Dalí-museum in Sint-Petersburg, Florida drukt op een deurbel naast een donker levensgroot scherm. Een verduisterde figuur in een keurig pak en met een potloodsnor verlaat langzaam zijn ezel en komt naar haar toe in het licht.
Het is, natuurlijk, Salvador Dalí, die de bezoeker aankijkt en vertelt over zijn kunst en zijn museum. Wanneer de bezoeker op het punt staat te vertrekken, hij verschijnt weer. Hij vraagt of ze een foto wil, haalt dan zijn mobiele telefoon tevoorschijn en maakt een selfie met haar.
Het fascinerende aan deze ontmoeting is dat het eigenlijk Dalí zelf is. Hoe is het mogelijk dat de grote Spaanse surrealist jaren na zijn dood nog kan communiceren met het publiek, zelfs een telefoon gebruiken die niet bestond toen hij nog leefde? Welkom in de wereld van deepfakes, een verontrustende technologie met een groot potentieel om te misleiden - en ook enkele onverwacht positieve toepassingen.
Deepfakes zijn een krachtige nieuwe techniek om realistische maar nep-video- of audio-inhoud te creëren. Om Dalí leven in te blazen, het museum gebruikte deep learning om een computer in staat te stellen het gezicht van een levende acteur die zich kleedde en gedroeg als Dalí naadloos te verwisselen met een digitaal gegenereerd beeld van het gezicht en de uitdrukkingen van de kunstenaar.
Dit omvat een "trainingsproces" waarin geavanceerde algoritmen voor machinaal leren de beelden van Dalí en de acteur doorzoeken om te leren nieuwe, echt uitziende gezichtsbeelden van beide mannen te genereren. Het leert ook een bestaand beeld van een van beide mannen te nemen en een beeld van de ander te genereren dat perfect past bij de gezichtsuitdrukkingen en hoofdhouding van de eerste.
Dit maakt het mogelijk om Dalí-gezichten te genereren die passen bij de bewegingen van de acteur, die vervolgens automatisch in de nieuwe video worden ingevoegd, waardoor een illusie ontstaat van Dalí zelf. Er is meer detail hier voor degenen die geïnteresseerd zijn.
Een kans biedt zich aan
Daten, de meeste producenten van deepfakes hebben de donkere kant van de technologie uitgebuit. Dit varieert van satire, zoals deze April Fool's Day-clip waarin Mark Zuckerberg aankondigt dat hij Facebook gaat verwijderen; tot reputatieschadelijke beelden van Hollywood-sterren die zogenaamd in pornofilms zouden spelen; tot fraude, zoals het nabootsen van de stem van een chief executive om de overdracht van een grote som geld te vragen.
De risico's van deepfakes zijn onmiskenbaar. Toch illustreert het voorbeeld van Dalí dat het onmogelijk is om zwart-wit te zijn over deze technologie. In ons onderzoek, we groeperen deepfakes in vijf categorieën:voice swapping, tekst naar spraak, video gezicht wisselen, full-body poppenspel en lip-synchronisatie. In elke categorie, we zien duidelijke zakelijke kansen. Sommige moeten nog worden gerealiseerd, terwijl andere al worden gerealiseerd.
1. Buikspreken 2.0
Voice swapping kan de stem van een persoon veranderen of iemand anders laten imiteren. Het kan worden gemanipuleerd om jonger of ouder te klinken, man of vrouw, en met verschillende dialecten of accenten. Mogelijke toepassingen zijn onder meer een verteller uit een audioboek die spreekt in de stemmen van verschillende personages, of een beroemd persoon als verteller gebruiken zonder dat ze de moeite hoeven te nemen om het hele verhaal voor te lezen.
Het opent ook fascinerende mogelijkheden voor virtuele assistenten zoals Siri. In plaats van stemacteurs met verschillende accenten en geslachten op te nemen, Audio voice swapping maakt het mogelijk om dit met slechts één stem te doen - voelt iemand een blockbuster-app opkomen?
2. Stemmen teruggeven
Het is al jaren mogelijk om een computer te laten spreken door tekst in een applicatie te typen. Nu bestaat de deepfake-technologie om dit te doen met de stem van een bepaalde persoon, zelfs als ze de betreffende woorden niet eerder hebben opgenomen. Dit wordt een levensveranderende technologie voor mensen die niet meer verstaanbaar kunnen spreken, zoals degenen die een beroerte hebben gehad of een progressieve ziekte hebben zoals amyotrofische laterale sclerose - zie de clip hieronder.
Andere mogelijke toepassingen van deze audio-tekst-naar-spraaktechnologie zijn onder meer het corrigeren van verkeerd uitgesproken woorden in een voice-over in plaats van dat de persoon het opnieuw moet opnemen.
3. "Praat je tegen mij?"
Zoals we zagen bij het voorbeeld van Dalí, video face swapping kan het gezicht van een persoon in een video vervangen door het gezicht van iemand anders. Dit heeft een groot potentieel in de films.
Bijvoorbeeld, een professionele deepfake-kunstenaar heeft aangetoond hoe vergelijkbare technieken als het Dalí-museum gebruikt hadden kunnen worden om Robert De Niro te verouderen in The Irishman, in plaats van de dure en tijdrovende CGI die ertoe heeft bijgedragen dat de totale productiekosten van de film op $ 175 miljoen (£ 135 miljoen) kwamen. De clip hieronder laat zien hoe deepfake-technologie een vergelijkbare kwaliteit kan bereiken. Een ander mogelijk gebruik van deze technologie zijn meer levensechte stuntdubbels.
4. Spel aan
Video-poppen met het hele lichaam kunnen beweging van het lichaam van de ene persoon naar dat van de andere overbrengen. Mogelijke toepassingen zijn onder meer meeslepende videogames waarin spelers zich in de actie kunnen mengen, met eigen loop- en bewegingskenmerken; en films waarin niet-dansende acteurs schijnbaar kunnen dansen met beelden van professionele dansers.
5. Ondertiteling RIP
Audio- en video-lipsynchronisatie kan mondbewegingen en gesproken woorden in een video veranderen. Het zal binnenkort mogelijk zijn om kosteneffectieve, hoogwaardige vertalingen van films, Tv-programma's en andere video's. Een getraind algoritme zou de stem van de originele acteur imiteren, maar in een andere taal, met de lipbeweging synchroon met de nieuwe woorden.
Dus hoewel het duidelijk is dat deepfakes schadelijk kunnen en worden gebruikt, dezelfde deep-learningtechnologie opent ook veel innovatieve zakelijke toepassingen. Veel creatieve en productieve mogelijkheden worden duidelijk - en ongetwijfeld vele andere die mensen nog niet eens hebben gezien.
Dit artikel is opnieuw gepubliceerd vanuit The Conversation onder een Creative Commons-licentie. Lees het originele artikel.
Wetenschap © https://nl.scienceaq.com