science >> Wetenschap >  >> Elektronica

Alexa, hoe evolueren woordzintuigen?

Krediet:CC0 Publiek Domein

Er zijn aanwijzingen dat het raakvlak tussen mens en technologie alleen maar meer centraal zal komen te staan ​​in het moderne leven.

Om mensen in staat te stellen zinvolle informatie te extraheren uit de schat aan gegevens die worden verzameld door de 'slimme' machines waarmee we communiceren, zoals mobiele telefoons, moeten computers taal kunnen verwerken zoals mensen. De tak van kunstmatige intelligentie die in deze behoefte voorziet, wordt natuurlijke taalverwerking genoemd.

Een paper genaamd "Algoritmes in de historische opkomst van woordbetekenissen" - dat vandaag online verschijnt in de Proceedings van de National Academy of Sciences ( PNAS )—is de eerste die naar 1 kijkt, 000 jaar Engelse ontwikkeling en detecteren de soorten algoritmen die de menselijke geest heeft gebruikt om bestaande woorden uit te breiden naar nieuwe betekenissen. Dit soort 'reverse engineering' van hoe menselijke taal zich heeft ontwikkeld, kan gevolgen hebben voor de verwerking van natuurlijke taal door machines.

"Om succesvol met mensen te communiceren, computers moeten woorden flexibel kunnen gebruiken, maar volgens dezelfde principes die het gebruik van taal door mensen leiden, " legt Barbara Malt uit, Directeur van het Cognitive Science Program aan de Lehigh University en een van de projectmedewerkers.

Volgens Malt, woorden accumuleren families van verwante zintuigen in de loop van de geschiedenis. Bijvoorbeeld, het woord 'gezicht' betekende oorspronkelijk het voorste deel van een hoofd, maar na verloop van tijd ging het ook het voorste deel van andere objecten betekenen, zoals het 'gezicht' van de klif, en een emotionele toestand, zoals het opzetten van een dapper 'gezicht'.

"Dit werk, " zegt Malt, "was gericht op het onderzoeken van de cognitieve processen die deze families van zintuigen creëren."

Het team, inclusief hoofdonderzoeker Yang Xu, een computerlinguïst van de Universiteit van Toronto en Mahesh Srinivasan, assistent-professor psychologie aan de University of California Berkeley, samen met Berkeley-student Christian Ramiro - identificeerde een algoritme genaamd "nearest-neighbor chaining" als het mechanisme dat het beste beschrijft hoe woordbetekenissen zich in de loop van de tijd ophopen.

Bij "nearest-neighbor chaining" worden invoerpunten geanalyseerd als een hiërarchie van clusters. Het model van de onderzoekers legde het ketenproces vast dat optreedt wanneer opkomende ideeën werden uitgedrukt met behulp van het woord met de meest verwante bestaande betekenis. Dit ketenmodel past beter bij het historische patroon van zintuiglijke opkomst dan alternatieve modellen.

"Het is een open vraag hoe de algoritmen die we hier hebben onderzocht direct kunnen worden toegepast om het machine-begrip van nieuw taalgebruik te verbeteren, " zegt Xu.

Na het ontwikkelen van de computationele algoritmen die de historische volgorde voorspelden waarin de betekenissen van een woord zijn ontstaan, het team heeft deze voorspellingen vergeleken met records van het Engels in het afgelopen millennium met behulp van de Historical Thesaurus of English, een grote database waarin elk van de vele betekenissen van een woord is gemarkeerd voor de datum waarop het in de taal is verschenen.

Hun bevindingen suggereren dat woordbetekenissen ontstaan ​​op een manier die cognitieve kosten minimaliseert, wat zijn de collectieve kosten van opwekking, interpreteren en leren van woordbetekenissen. Met andere woorden, nieuwe woordbetekenissen ontstaan ​​door een efficiënt mechanisme dat nieuwe ideeën uitdrukt via een compacte reeks woorden.

"Als opkomende ideeën in het Engels worden gecodeerd, ze worden eerder gecodeerd door de betekenis van een bestaand woord uit te breiden dan door een nieuw woord te creëren, ", zegt Malt. "Een populair idee is misschien dat wanneer je een nieuw idee hebt, je er een nieuw woord voor moet verzinnen, maar we ontdekten dat deze strategie eigenlijk minder vaak voorkomt."

Vorig jaar, hetzelfde team was de eerste die een reeks principes identificeerde voor een ander aspect van taalontwikkeling:metaforische mapping.

In het afgelopen millennium, woordbetekenissen zijn grotendeels geëvolueerd van letterlijke domeinen naar metaforische domeinen - metaforische mapping genoemd. Woorden die oorspronkelijk alleen een concrete of uiterlijke betekenis hadden (zoals het 'grijpen' van een fysiek object) hebben betekenis gekregen in het rijk van het abstracte en interne (zoals in het 'grijpen' van een idee). De groep was de eerste die aantoonde dat deze progressie een compacte set van psychologische en cognitieve principes heeft gevolgd en dat de beweging over de rijken kan worden voorspeld.

De bevindingen van de groep werden gepubliceerd in Cognitive Psychology in een artikel met de titel "Evolutie van woordbetekenissen door metaforische mapping:Systematicity over the afgelopen millennium."

"Samen, onze studies beginnen aan te tonen dat de manieren waarop woorden nieuwe betekenissen hebben ontwikkeld niet willekeurig zijn, maar in plaats daarvan de fundamentele eigenschappen weerspiegelen van hoe we denken en met elkaar communiceren, " legt Mahesh Srinivasan uit, Assistant Professor of Psychology and director of the Language and Cognitive Development laboratory at UC Berkeley