Wetenschap
Onderzoekers schreven een eenvoudig script dat figuratieve uitdrukkingen identificeert en vervangt door hun letterlijke betekenis. Als gevolg hiervan verbeterden de prestaties van dialoogsystemen tot 15 procent. Krediet:Universiteit van Californië, San Diego
Computerwetenschappers onderzochten onlangs de prestaties van dialoogsystemen, zoals persoonlijke assistenten en chatbots die zijn ontworpen om met mensen te communiceren. Het team ontdekte dat wanneer deze systemen worden geconfronteerd met dialogen die idioom of vergelijkingen bevatten, hun prestaties dalen tot tussen de 10 en 20 procent.
Het onderzoeksteam ontwikkelde ook een gedeeltelijke remedie. Ze schreven een eenvoudig script dat figuratieve uitdrukkingen identificeert en vervangt door hun letterlijke betekenis. Als gevolg hiervan zijn de prestaties van dialoogsystemen tot 15 procent verbeterd.
De onderzoekers presenteren hun bevindingen op de 2021 Conference on Empirical Methods in Natural Language Processing, die plaatsvindt van 7 tot 11 november 2021.
Toepassingen voor dit werk omvatten niet alleen persoonlijke assistenten, maar ook systemen die zijn ontworpen om informatie samen te vatten, zoals het vak met zoekresultaten bovenaan een Google-pagina. Ook geautomatiseerde systemen die vragen moeten beantwoorden, bijvoorbeeld wanneer een rekening moet worden betaald of een afspraak moet worden gemaakt, zouden baat hebben bij dit werk.
"We willen natuurlijkere gesprekken tussen mensen en dialoogsystemen mogelijk maken", zegt Harsh Jhamtani, de eerste auteur van het artikel.
Jhamtani is een Ph.D. student aan de Carnegie Mellon University en werkt momenteel als gastonderzoeker bij senior auteur Taylor Berg-Kirkpatrick, een faculteitslid van de UC San Diego Department of Computer Science and Engineering.
De studie werd geïnspireerd door Jhamtani's eigen worsteling met beeldtaal. Hij is een native speaker Hindi en spreekt ook Engels, de andere officiële taal van India. Maar hij moest de vele Amerikaanse uitdrukkingen en metaforen leren die zijn collega's gebruiken.
Hij raakte bijvoorbeeld in paniek toen een collega zei dat ze honger hadden omdat dat in het Hindi op een medisch noodgeval zou kunnen duiden. Zijn collega legde toen uit dat het alleen maar betekende dat hij honger had. Tegen die tijd vroeg Jhamtani zich af of kunstmatige dialoogsystemen hetzelfde probleem zouden hebben als hij.
Krediet:Universiteit van Californië, San Diego
In het onderzoek testten onderzoekers vijf verschillende systemen die zijn ontworpen om met mensen te praten, waaronder GPT-2, dat is getraind om het volgende woord te voorspellen in 40 GB aan internettekst en is ontwikkeld door onderzoeksbureau OpenAI.
Onderzoekers hebben de dialoogsystemen eerst door een dataset van 13.1K gesprekken geleid over alledaagse onderwerpen zoals toerisme, gezondheid enzovoort. Vervolgens haalden ze de gesprekken met beeldtaal uit de dataset en lieten de systemen alleen die doornemen. Ze zagen een prestatiedaling van 10 tot 20 procent.
Vervolgens schreven ze een script waarmee de systemen snel woordenboeken konden controleren die figuurlijke spraak in letterlijke spraak vertalen. Dit is sneller en efficiënter dan omscholingssystemen om de volledige inhoud van deze woordenboeken te leren. Onderzoekers merkten op dat de prestaties met maar liefst 15 procent verbeterden.
De onderzoekers moesten nog gedeeltelijk vertrouwen op menselijke waarnemers om beeldtaal binnen de dataset te identificeren, voordat de tekst kon worden omgezet. Verdere studie is nodig op dit gebied.
Het zal een aantal iteraties duren voordat de algoritmen die de onderzoekers hebben ontwikkeld klaar zijn voor implementatie. Ze ontdekten bijvoorbeeld dat in enkele zeldzame gevallen het vervangen van de figuurlijke taal door letterlijke taal de grammatica van een zin zodanig vervormde dat de dialoogsystemen het niet langer konden begrijpen.
Meervoudig mierachtig transport van neuronale lading door motoreiwitten
Autoplastics omzetten in schuim met kokosolie
bloederig, gek, cool:zeeslakkengif kan insuline voor diabetespatiënten verbeteren
Mysterie van faseverandering in sub-nanoseconde-octaëders structuurmotief
Gemakkelijke manier om waarden te onthouden
Herstel natuurlijke bossen om de wereldwijde klimaatdoelstellingen te halen
Vijf verschillende soorten weerkaarten
Uitbreiding landbouwgrond vermindert CO2-opname
Big data op social media platform onthult positieve gezichtsuitdrukkingen van vrouwelijke bezoekers in stadsbossen
Sterkste tornado in 8 decennia treft Cuba; 3 doden, 172 pijn
Klimaatrapport moet doodsklok zijn voor fossiele brandstoffen:VN-chef
Nieuw onderzoek vindt ontbrekende schakel tussen hechting van zachte oppervlakken en oppervlakteruwheid
Kunstmatige intelligentie helpt bij het opsporen van mysterieuze kosmische radioflitsen
Nieuwe goedkope tactiele sensor laat robots voelen
Stellaire wind van oude sterren onthult het bestaan van een partner
Gewaardeerde gegevens, gratis en open voor iedereen
Fusie van neutronensterren bevestigt decennia van voorspellingen
Predictive touch response-mechanisme is een stap in de richting van een tactiel internet
Wetenschap © https://nl.scienceaq.com