Wetenschap
Krediet:IBM
De wedstrijd begon toen de vrouwelijke stem van de computer, een mix van Amazon's Alexa en Stephen Hawking's communicator, sprak tot zijn menselijke tegenstander:"Hallo Noa. We ontmoeten elkaar weer."
Ik was de enige academicus die werd uitgenodigd in de overvolle zaal van ongeveer 50 journalisten om getuige te zijn van de recente wedstrijd tussen de kunstmatige intelligentie van IBM's Project Debater en de Israëlische debatkampioenen Noa Ovadia en Dan Zafrir. De openingszet zorgde voor giechelen en eye-rolling van het publiek. Ik was meer een eye-roller - ik ben er niet van overtuigd dat voor de hand liggend pre-script materiaal echt helpt bij het presenteren van AI-technologieën. Wat volgde was echter onmiskenbaar een indrukwekkend staaltje techniek, maar het is misschien te gemakkelijk om te denken dat sci-fi AI nu net om de hoek is.
Project Debater volgt de aankondiging dat Google een AI-technologie heeft ontwikkeld die bekend staat als Duplex en die natuurlijk klinkende telefoongesprekken kan voeren om afspraken te boeken en andere taken uit te voeren. Beide projecten zien eruit alsof ze AI omvatten die de competentie op menselijk niveau benadert, die de Turing-test zou kunnen doorstaan, en binnenkort de wereld domineren, misschien. Maar dit is een illusie die voortkomt uit de zorgvuldige marketing van deze enorme bedrijven. De realiteit is dat we ons nog in de vroegste dagen bevinden van het begrijpen van AI.
Na de aanvankelijke menigte-aangename tactieken, IBM's computer produceerde een toespraak van vier minuten, op de vlucht, over een willekeurig gekozen onderwerp uit een lijst van 40 waarover het nog niet was getraind om te debatteren. Dit deed het door te identificeren, classificeren, het selecteren en samenvoegen van fragmenten uit een bibliotheek van 300 miljoen nieuwsartikelen. Het resultaat was grotendeels grammaticaal correct, semantisch op de boodschap en min of meer coherent. Het systeem was vervolgens in staat om te luisteren en te reageren op een soortgelijke verklaring van zijn menselijke tegenstander.
Het is misschien de moeite waard om na te denken over hoe moeilijk deze taken zijn. Een gesprek voeren is een enorme uitdaging als je eenmaal verder gaat dan heel gestructureerd, streng gecontroleerde domeinen. Diepe leersystemen, geïnspireerd door het menselijk brein, proberen alles wat de mens zegt in kaart te brengen op een relatief klein aantal mogelijke zetten met een klein aantal mogelijke waarden. Google Duplex werkt nog steeds binnen een specifiek domein, zoals het boeken van een diner, en kan dus zeer robuust zijn.
Het hebben van een argument is nog veeleisender. Het is opmerkelijk moeilijk om een algoritme te bouwen om betrouwbaar te bepalen of een bepaalde zin je standpunt ondersteunt of niet. Op één niveau, het IBM-team heeft het voor elkaar gekregen, waarbij Project Debater zijn coherente en overtuigende verklaring van vier minuten produceerde. Ik was ook erg onder de indruk dat de grammaticale structuur van de computer zo goed was, vooral omdat elke zin kan zijn ontleend aan meerdere artikelen in de bibliotheek.
Technologie nog beperkt
Maar naarmate de toespraak vorderde, Ik kreeg het duidelijke gevoel dat de thematische structuur afbrokkelde, met de stroom die tussen onderwerpen fladdert. De machine eindigde op het punt van vier minuten met een mooie retorische zwaai van anticiperen en aanvallen op het argument van de tegenstander (bekend als procatalepsis). Maar later, het twee minuten durende weerwoord van de computer aan zijn menselijke tegenstander klonk steeds meer als louter herhaling.
Project Debater heeft belangrijke nieuwe vorderingen gemaakt op gebieden zoals het zoeken in teksten naar argumenten (argument mining) in combinatie met technische oplossingen zoals grammaticaal herstel waarbij zinsdelen aan elkaar worden gelijmd. Maar, als redenaar, de computer maakt nog steeds zijn eerste piepjes.
Het systeem heeft slechts de meest rudimentaire notie van argumentatiestructuur en wijkt zo vaak af van het hoofdthema. Het besteedt geen aandacht aan zijn publiek, noch zijn tegenstander, en heeft geen manier om zijn taal aan te passen of een van de honderden slimme retorische technieken uit te buiten die helpen om het publiek voor zich te winnen
Noch IBM, noch Google beweren, of zelfs intimiderend, dat ze alle AI-problemen hebben opgelost, of gebouwde machines met prestaties op menselijk niveau. In beide gevallen, de programmeurs hebben specifieke doelen voor ogen die min of meer direct leiden tot commerciële technologie.
De echte waarde van argumenttechnologie als geheel zal niet worden geleverd in de debatkamer, maar in toepassingen waarin AI-systemen kunnen bijdragen aan menselijke besluitvormingsteams. Of het nu in de meldkamer van de politie is, de inlichtingen-analysebunker of het klaslokaal, het kan alleen maar goed zijn om de robuustheid van evidence-based besluitvorming te vergroten door AI-systemen te introduceren die kunnen bijdragen aan het gesprek. Ze zullen nieuwe informatie kunnen toevoegen of menselijke redeneringen kunnen bekritiseren.
Project Debater is een waardevolle stap voorwaarts in de richting van dit doel, en het bredere doel om AI te bouwen die ons echt kan begrijpen en erop kan reageren. Maar we staan zeker niet op het punt te zien dat AI-systemen hun menselijke tegenhangers in twijfel trekken. De huidige AI-technologie is net zo ver verwijderd van deze scenario's als de experimenten van de Romeinen met stoomkracht van de industriële revolutie.
Dit artikel is oorspronkelijk gepubliceerd op The Conversation. Lees het originele artikel.
Wetenschap © https://nl.scienceaq.com