science >> Wetenschap >  >> Elektronica

De technologie van spraakassistenten dreigt te menselijk te zijn

Krediet:tomasso79/Shutterstock

Meer dan 200 miljoen huizen hebben nu een slimme luidspreker die spraakgestuurde toegang tot internet biedt, volgens een globale schatting. Voeg dit toe aan de pratende virtuele assistenten die op veel smartphones zijn geïnstalleerd, om nog maar te zwijgen van keukenapparatuur en auto's, en dat zijn veel Alexas en Siris.

Omdat praten een fundamenteel onderdeel is van het mens-zijn, het is verleidelijk om te denken dat deze assistenten ontworpen moeten zijn om te praten en zich te gedragen zoals wij. Hoewel dit ons een herkenbare manier zou geven om met onze apparaten te communiceren, het repliceren van echt realistische menselijke gesprekken is ongelooflijk moeilijk. Bovendien, onderzoek suggereert dat het onnodig en zelfs oneerlijk kan zijn om een ​​machine menselijk te laten klinken. In plaats daarvan, we moeten misschien opnieuw nadenken over hoe en waarom we omgaan met deze assistenten en leren de voordelen te omarmen van het feit dat ze een machine zijn.

Ontwerpers van spraaktechnologie praten vaak over het concept 'menselijkheid'. Recente ontwikkelingen in de ontwikkeling van kunstmatige stemmen hebben ertoe geleid dat de stemmen van deze systemen de grens tussen mens en machine doen vervagen, steeds menselijker klinken. Er zijn ook pogingen gedaan om de taal van deze interfaces menselijker te laten lijken.

Misschien wel de meest bekende is Google Duplex, een dienst die telefonisch afspraken kan boeken. Om toe te voegen aan de menselijke aard van het systeem, Google heeft uitspraken als "hmm" en "uh" toegevoegd aan de spraakuitvoer van zijn assistent - geluiden die we vaak gebruiken om aan te geven dat we naar het gesprek luisteren of dat we van plan zijn binnenkort te gaan praten. In het geval van Google Duplex, deze werden gebruikt met het doel natuurlijk te klinken. Maar waarom is het zo belangrijk om natuurlijk of menselijker te klinken?

Het nastreven van dit doel om systemen te laten klinken en zich te gedragen zoals wij, komt misschien voort uit inspiraties uit de popcultuur die we gebruiken om het ontwerp van deze systemen van brandstof te voorzien. Het idee om met machines te praten heeft ons gefascineerd in de literatuur, televisie en film voor decennia, door personages zoals HAL 9000 in 2001:A Space Odyssey of Samantha in Her. Deze karakters portretteren naadloze gesprekken met machines. In het geval van Haar, er is zelfs een liefdesverhaal tussen een besturingssysteem en zijn gebruiker. Kritisch, al deze machines klinken en reageren zoals we denken dat mensen zouden doen.

Er zijn interessante technologische uitdagingen om iets te bereiken dat lijkt op gesprekken tussen ons en machines. Hiertoe, Amazon heeft onlangs de Alexa Prize gelanceerd, op zoek naar "socialbots creëren die coherent en boeiend met mensen kunnen praten over een reeks actuele gebeurtenissen en populaire onderwerpen zoals entertainment, sport, politiek, technologie, en mode." De huidige wedstrijdronde vraagt ​​teams om een ​​gesprek van 20 minuten te maken tussen een van deze bots en een menselijke interactie.

Deze grote uitdagingen, net als anderen in de wetenschap, duidelijk de stand van de techniek bevorderen, geplande en ongeplande voordelen opleveren. Maar als we ernaar streven machines het vermogen te geven om echt met ons te praten zoals andere mensen, we moeten nadenken over waar onze gesproken interacties met mensen eigenlijk voor zijn en of dit hetzelfde is als het soort gesprek dat we met machines willen voeren.

We praten met andere mensen om dingen gedaan te krijgen en om relaties met elkaar op te bouwen en te onderhouden - en vaak zijn deze twee doelen met elkaar verweven. Toch zien mensen machines als gereedschappen die een beperkt doel dienen en hebben ze weinig trek in het opbouwen van het soort relaties met machines dat we elke dag met andere mensen doen.

Natuurlijke gesprekken voeren met machines die op ons lijken, kan een onnodige en lastige doelstelling worden. Het schept onrealistische verwachtingen van systemen die daadwerkelijk kunnen communiceren en begrijpen zoals wij. Iedereen die interactie heeft gehad met een Amazon Echo of Google Home weet dat dit niet mogelijk is met bestaande systemen.

Dit is van belang omdat mensen een idee moeten hebben van hoe ze een systeem dingen kunnen laten doen die, omdat spraakinterfaces beperkte knoppen en beelden hebben, worden in belangrijke mate geleid door wat het systeem zegt en hoe het het zegt. Het belang van interface-ontwerp betekent dat menselijkheid zelf niet alleen twijfelachtig, maar ook bedrieglijk kan zijn. vooral als het wordt gebruikt om mensen voor de gek te houden door te denken dat ze interactie hebben met een andere persoon. Zelfs als het hun bedoeling is om verstaanbare stemmen te creëren, technologiebedrijven moeten rekening houden met de mogelijke gevolgen voor gebruikers.

Verder kijken dan menselijkheid

In plaats van consequent menselijkheid te omarmen, we kunnen accepteren dat er fundamentele grenzen kunnen zijn, zowel technologisch als filosofisch, tot de soorten interacties die we met machines kunnen en willen hebben.

We moeten ons laten inspireren door menselijke gesprekken in plaats van ze te gebruiken als een vermeende gouden standaard voor interactie. Bijvoorbeeld, kijken naar deze systemen als performers in plaats van mensachtige gesprekspartners, kan een manier zijn om meer boeiende en expressieve interfaces te creëren. In sommige contexten kan het nodig zijn om specifieke gesprekselementen op te nemen, maar we moeten nadenken of mensachtige gespreksinteractie nodig is, in plaats van het als een standaardontwerpdoel te gebruiken.

Het is moeilijk te voorspellen hoe technologie er in de toekomst uit zal zien en hoe de sociale percepties zullen veranderen en zich rondom onze apparaten zullen ontwikkelen. Misschien vinden mensen het goed om met machines te praten, vrienden worden met robots en hun advies vragen.

Maar daar staan ​​we momenteel sceptisch tegenover. Volgens ons heeft het allemaal met context te maken. Niet alle interacties en interfaces zijn hetzelfde. Sommige spraaktechnologie kan nodig zijn om een ​​of andere vorm van sociale of emotionele band tot stand te brengen en te bevorderen, zoals in specifieke zorgtoepassingen. Als dat het doel is, dan is het logisch om machines voor dat doel geschikter te laten converseren - misschien klinkt het menselijk, zodat de gebruiker de juiste soort verwachtingen krijgt.

Toch is dit niet overal nodig. Cruciaal, deze menselijke gelijkenis moet aansluiten bij wat de systemen daadwerkelijk kunnen doen met conversatie. Het maken van systemen die niet het vermogen hebben om als een menselijk geluid te communiceren, kan veel meer kwaad dan goed doen.

Dit artikel is opnieuw gepubliceerd vanuit The Conversation onder een Creative Commons-licentie. Lees het originele artikel.