Wetenschap
Ydych chi'n siarad Cymraeg? Krediet:Gouden Sikorka/Shutterstock
Baanbrekende slimme huistechnologieën en spraakassistenten doen dat niet, als een regel, Welsh spreken - hoewel de regering van Wales daar nu verandering in wil brengen door middel van haar Welsh Language Technology Action Plan. Maar is hun doel haalbaar, Is het noodzakelijk, en hoe kan het?
AI-spraakhulpmiddelen (zoals de Pixelbuds van Google) zijn sterk afhankelijk van het gebruik van grote datasets om een taal te leren, zijn uitspraak, grammatica en semantiek. Het vermogen of de kwaliteit van de resulterende tools wordt voornamelijk beperkt door de hoeveelheid data die beschikbaar is (en hoe "goed" deze is). Dit betekent dat, in theorie althans hulpmiddelen voor een minderheidstaal als het Welsh kunnen niet zo capabel worden als die voor een reguliere taal.
Talen met beperkte hoeveelheden goede trainingsgegevens die beschikbaar zijn, worden "low resource"-talen genoemd. Vergeleken met het Engels, Welshe bronnen zijn schaars, maar er zijn enkele duizenden talen met minder sprekers, en waarschijnlijk veel armere hulpbronnen, dan Welsh.
Gelukkig wordt er goed onderzoek gedaan naar een machine learning-techniek genaamd 'transfer learning'. Hierdoor kunnen systemen leren met behulp van de ene set gegevens en deze kennis vervolgens toepassen in een andere. In China wordt het gebruikt voor automatische spraakherkenning (ASR) van het Tibetaans, waarvoor vrijwel geen gegevens beschikbaar zijn voor training. Het ASR-systeem leerde Chinees – wat taalkundig heel anders is dan Tibetaans – en werd vervolgens bijgeschoold of verfijnd om Tibetaans te ‘begrijpen’. Er is eigenlijk veel gemeenschappelijkheid tussen veel talen - gedeelde of geleende woorden en uitspraakpatronen - die dit soort techniek helpt.
AI omscholen in het Welsh
Er is dus geen reden waarom AI-systemen niet kunnen worden geproduceerd om te converseren in het Welsh of andere minderheidstalen. Maar is er een reden waarom het zou moeten? Alle spraaktechnologie, slimme huizen en spraakinteractiesystemen die tegenwoordig worden gebruikt, zijn de producten van commercieel onderzoek. Bot gezegd, ze bestaan om ofwel geld te verdienen met uw gegevens, om u meer goederen en diensten te verkopen, of om je denken te beïnvloeden. Niets van deze AI bestaat voor het algemeen belang.
Een systeem maken dat goed werkt met Welsh is misschien niet zo eenvoudig als alles in het Engels ontwerpen. Met de huidige technologie, Er zijn spraak-AI-experts nodig (en we zijn duur). Er zal behoefte zijn aan Welsh trainings- en testmateriaal, en Welsh sprekende testers moeten worden betrokken. De gevaren van het niet betrekken van Welsh-sprekers bij het vertaalproces zijn in het verleden ruimschoots aangetoond, wanneer een afwezigheidsbericht op een verkeersbord terechtkwam
Tenzij er een sterk genoeg economisch argument is, verwacht niet dat grote bedrijven zich haasten om Welsh te produceren, Gaelic of Cornish spraaksystemen. Zelfs techgigant Samsung is er nog niet in geslaagd om een Brits-Engels sprekende versie van hun Bixby-assistent te produceren (internationale Engelssprekenden moeten er in nep-Amerikaanse accenten mee spreken om het te laten werken). Zelfs de Amerikaans-Engelse versie liep vertraging op vanwege een gebrek aan middelen.
En zolang Welsh-sprekers graag gebruik maken van Engelstalige AI-systemen, er is misschien geen economisch argument - tenzij de regering van Wales besluit te betalen om het te laten gebeuren, wat het tot dusver niet heeft gedaan (het actieplan is in dit stadium een "verbintenis").
AI te hulp
De technologie rukt op en technieken zoals transfer learning worden elke dag capabeler. Hierdoor kon eerder onderzoek naar taalaanpassing worden opgefrist en uitgebreid naar de ontwikkeling van meertalige deep learning-technieken. In de tussentijd, toenemend gebruik van andere soorten digitale technologie door Welsh-sprekers heeft de verzameling van bronnen in de taal verbeterd, net als Welsh TV en radio. Deze vooruitgang betekent dat de kosten voor het lokaliseren van systemen voor het Welsh (en andere minderheidstalen) dalen.
Onderzoek naar hersenachtige leeralgoritmen kan hier de sleutel zijn. Dit is technologie die tijdens het gebruik voortdurend kan leren, net zoals mensen een nieuwe taal leren spreken. Het is anders dan de meeste huidige AI-systemen die in het lab worden getraind, voordat ze in het wild worden losgelaten - op enkele uitzonderingen na, zoals Microsoft's Tay, bekend om hun spectaculaire mislukkingen. Toekomstige systemen zullen geleidelijk vaardigheden in een tweede taal kunnen verwerven door gebruikers geleidelijk meer en meer van die taal te laten introduceren in hun dagelijkse interacties. In plaats van onderzoek naar spraak-AI in Wales te financieren, de regering van Wales zou het misschien beter kunnen doen door onderzoek naar dit nieuwe soort adaptieve leertechnologie te ondersteunen.
Omdat alle huidige spraak-AI-systemen de spraak centraal afhandelen (dit gebeurt niet in het apparaat, maar in een externe serverfarm), deze systemen kunnen gegevens verzamelen van honderden gebruikers over de hele wereld (of over heel Wales) om snel te leren. Dus de boodschap aan Welsh-sprekers van vandaag kan zijn om die Engelstalige Google Home of Amazon Alexa niet te kopen als je wilt dat Google of Amazon een systeem produceert dat in het Welsh werkt. Maar als je er een hebt, terwijl de software zich de komende jaren ontwikkelt, probeer er zoveel mogelijk Welsh tegen te praten. Het zal jou en Siaradwch â chi yn Gymraeg misschien verbazen.
Dit artikel is opnieuw gepubliceerd vanuit The Conversation onder een Creative Commons-licentie. Lees het originele artikel.
Wetenschap © https://nl.scienceaq.com