science >> Wetenschap >  >> anders

Taalkundigen voorspellen onbekende woorden met behulp van taalvergelijking

Kaart met geografische locaties voor sprekers van acht westerse Kho-Bwa-talen. Krediet:Johann-Mattis List

Voor een lange tijd, Historische taalkundigen hebben de vergelijkende methode gebruikt om eerdere staten van talen te reconstrueren die niet in geschreven bronnen zijn geattesteerd. De methode bestaat uit de gedetailleerde vergelijking van woorden in de verwante afstammelingentalen en stelt taalkundigen in staat om de oude uitspraak van woorden die nooit in welke vorm dan ook tot in detail zijn vastgelegd, af te leiden. Dat de methode ook kan worden gebruikt om af te leiden hoe een woord zonder papieren in een bepaalde taal zou klinken, op voorwaarde dat ten minste enige informatie over die taal, evenals informatie over verwante talen is beschikbaar, is al lang bekend, maar tot nu toe nooit expliciet getest.

Twee onderzoekers van SOAS University of London en het Max Planck Institute for the Science of Human History hebben onlangs een paper gepubliceerd in het gerenommeerde internationale tijdschrift voor historische taalkunde, diachronica . In het artikel, ze beschrijven de resultaten van een experiment waarin ze de traditionele vergelijkende methode toepasten om de uitspraak van woorden in acht westerse Kho-Bwa-taalvariëteiten die in India worden gesproken, expliciet te voorspellen. Behorend tot de Trans-Himalaya-familie (ook bekend als de Sino-Tibetaanse en Tibeto-Birmaanse taalfamilie), deze variëteiten zijn nog niet in detail beschreven en veel woorden waren nog niet gedocumenteerd in veldwerk. De wetenschappers begonnen hun experiment met een bestaande etymologische dataset van westerse Kho-Bwa-variëteiten die werd verzameld tijdens veldwerk in de Indiase staat Arunachal Pradesh tussen 2012 en 2017. Binnen de dataset, de auteurs constateerden meerdere hiaten waarin de woordvormen voor bepaalde concepten ontbraken.

"Bij het uitvoeren van veldwerk, het is onvermijdelijk dat u enkele woorden mist. Best vervelend als je dat achteraf constateert, maar in dit geval we realiseerden ons dat dit de perfecte gelegenheid was om te testen hoe goed de methoden voor taalkundige reconstructie werken, " zegt Tim Bodt, eerste auteur van de studie.

De onderzoekers zetten een computergestuurde workflow op om de ontbrekende woordvormen te voorspellen. De klassieke methoden worden traditioneel handmatig toegepast, maar de nieuwe computationele oplossingen hielpen de geleerden om de efficiëntie en betrouwbaarheid van het proces te vergroten, en alle resultaten werden later handmatig gecontroleerd en verfijnd. Om de transparantie en validiteit van het experiment te vergroten, vervolgens registreerden ze hun voorspellingen online.

"Registratie is ongelooflijk belangrijk op veel wetenschappelijke gebieden omdat het ervoor zorgt dat onderzoekers zich houden aan goede wetenschappelijke praktijken, maar voor zover wij weten is het nooit gedaan in de historische taalkunde, " zegt Johann-Mattis List, die de computationele analyses van het onderzoek heeft uitgevoerd.

"Door onze voorspellingen online te registreren, we hebben ervoor gezorgd dat we onze voorspellingen niet langer konden wijzigen in het licht van de resultaten die we hebben verkregen tijdens ons daaropvolgende verificatieproces, "Bod, voegt toe.

Met voorspellingen in de hand, Bodt reisde vervolgens naar India om de voorspelde woorden te verifiëren bij moedertaalsprekers van de westerse Kho-Bwa-talen. Na de deelnemende lokale taalconsulenten te hebben gevraagd hun woorden te geven voor de concepten die worden onderzocht, de auteurs vergeleken deze geattesteerde woorden met hun eerdere voorspellingen. Op basis van het aandeel correct voorspelde klanken per woordvorm, de voorspellingen waren in 76% van alle gevallen correct, wat opmerkelijk is gezien de beperkte hoeveelheid informatie die werd gebruikt om de woordvormen te voorspellen. Bovendien, de geleerden waren in staat om verschillende redenen te identificeren waarom bepaalde voorspellingen niet overeenkwamen met de werkelijke geattesteerde vormen in de talen.

"Hoe meer we weten over een taalfamilie in het algemeen, hoe beter we onbekende woordvormen kunnen voorspellen. Dit is allemaal mogelijk, omdat talen hun geluidssystemen verrassend regelmatig veranderen, ", zegt List. "Ondanks het feit dat er zo weinig bekend was over de westerse Kho-Bwa-talen en hun taalkundige geschiedenis, we konden door ons experiment laten zien dat regelmatige klankveranderingen resulteren in voorspelbare woordvormen. Beurtelings, ons experiment heeft ons begrip van de westerse Kho-Bwa-talen en hun taalkundige geschiedenis aanzienlijk verbeterd."

Naast het geven van een concreet voorbeeld voor de kracht van de methodologie van de historische taalkunde en de waarde van hun experiment voor taalstudies, de auteurs identificeren bepaalde extra voordelen van het voorspellen van woorden in taalkundig onderzoek.

"Het voorspellen van woorden verhoogt de transparantie en efficiëntie van ons onderzoek en ons veldwerk. Dit is cruciaal in het licht van snel taalverlies en beperkte financiering voor beschrijvend taalkundig werk. Bovendien, het heeft ook een educatief aspect omdat het sprekers aanmoedigt om na te denken over hun eigen taalkundige erfgoed, " zegt Bod.

De onderzoekers hopen dat de resultaten van hun baanbrekende experiment andere taalkundige veldwerkers zullen aanmoedigen, beschrijvende taalkundigen, en historische taalkundigen om dit voorbeeld te volgen, en explicieter en bewuster gebruik te maken van de regelmaat van klankverandering en voorspellingen van woordvormen.