science >> Wetenschap >  >> Elektronica

Chinees naar Engels vertalen:niet menselijk, maar uitzonderlijk

Krediet:CC0 Publiek Domein

Microsoft heeft woensdag aangekondigd dat zijn laboratoria een AI-machinevertaalsysteem hebben ontwikkeld dat met dezelfde nauwkeurigheid van Chinees naar Engels kan vertalen als een mens. De onderzoekers zitten in de Aziatische en Amerikaanse laboratoria van Microsoft.

Microsoft beschouwt dit als een historische mijlpaal in Neural Machine Translation, omdat het een menselijke gelijkwaardigheid heeft bereikt voor vertalingen van Chinees naar Engels.

We zullen, het is geen geringe prestatie. In vertaling, er zijn geen absoluut "juiste" manieren, omdat er variaties zijn in hoe iemand dezelfde gedachte kan doorgeven. Anderzijds, we weten hoe het is om op "Engels" te klikken op een document dat niet in het Engels is, of klik op "vertaal deze pagina, " om onverstaanbare woordreeksen in het Engels te ontdekken die je gewoon niet kunt hergebruiken.

Xuedong Huang, technisch medewerker die verantwoordelijk is voor de toespraak van Microsoft, natuurlijke taal en machinevertalingen, zei, "Het bereiken van menselijke pariteit in een machinevertalingstaak is een droom die we allemaal hebben gehad, " Huang zei. Huang werd geciteerd in De AI-blog (een officiële Microsoft-blog).

Wat ondersteunt hun bewering? Volgens Microsoft, een industriestandaard testset van nieuwsverhalen om de resultaten van menselijke en machinevertalingen te vergelijken, werd toegepast.

Niet alleen dat; het team huurde een groep tweetalige menselijke beoordelaars in. Ze werden gevraagd om de resultaten te vergelijken met een andere reeks door mensen geproduceerde vertalingen.

Dus wat maakt hun poging succesvol? De sleutelwoorden voor een antwoord lijken diepe neurale netwerken te zijn, dat gaat allemaal over manieren om AI-systemen te trainen.

Het voordeel is dat je vloeiender, natuurlijk klinkende vertalingen.

"Veel van ons onderzoek is echt geïnspireerd door hoe wij mensen dingen doen, " zei Tie-Yan Liu, een hoofdonderzoeksmanager bij Microsoft Research Asia in Peking.

In De AI-blog , Allison Linn noemde en beschreef hun technieken:fact-checking, overleg netwerken, gezamenlijke opleiding, en overeenkomst regularisatie.

Bij factchecken, elke keer dat ze een zin door het systeem stuurden om van het Chinees naar het Engels te worden vertaald, het onderzoeksteam vertaalde het ook terug van het Engels naar het Chinees. Het voordeel van feitencontrole is dat "het systeem het systeem kon verfijnen en van zijn eigen fouten kon leren."

In overlegnetwerken "De onderzoekers leerden het systeem om het proces van het steeds opnieuw vertalen van dezelfde zin te herhalen, het geleidelijk verfijnen en verbeteren van de reacties."

Bij gezamenlijke training het Engels-naar-Chinees vertaalsysteem vertaalt nieuwe Engelse zinnen in het Chinees om nieuwe zinnenparen te verkrijgen. Die worden vervolgens gebruikt om de trainingsdataset aan te vullen die in de tegenovergestelde richting gaat, van Chinees naar Engels. Dezelfde procedure wordt vervolgens in de andere richting toegepast. Terwijl ze samenkomen, de prestaties van beide systemen verbeteren.

In overleg regularisatie, de vertaling kan worden gegenereerd door het systeem van links naar rechts of van rechts naar links te laten lezen om naar dezelfde vertaling te zoeken.

"Machinevertaling is veel complexer dan een pure patroonherkenningstaak, "Zei Zhou. "Mensen kunnen verschillende woorden gebruiken om precies hetzelfde uit te drukken, maar je kunt niet per se zeggen welke beter is."

Een discussie over "neural machine translation"-technologieën verschijnt in de onderzoekspaper, "Het bereiken van menselijke pariteit op automatische Chinese naar Engelse nieuwsvertaling."

De auteurs zeiden dat uit hun evaluatie bleek dat hun systeem gelijkwaardig was aan professionele menselijke vertalingen op de WMT 2017 Chinees-Engelse nieuwstaak.

Dus, is hun werk voor zo'n neuraal machinevertaalsysteem afgelopen? Moeten menselijke vertalers irrelevant worden?

Liu, volgens De AI-blog , zei dat niemand weet of automatische vertaalsystemen ooit goed genoeg zullen zijn om elke tekst in een talenpaar te vertalen met de nauwkeurigheid en lyriek van een menselijke vertaler.

Tegelijkertijd, hij voegde toe, de doorbraken stellen de teams in staat om door te gaan naar de volgende grote stappen in de richting van dat doel en andere AI-prestaties.

© 2018 Tech Xplore