science >> Wetenschap >  >> Elektronica

Een nieuwe benadering voor parafraseren zonder toezicht zonder vertaling

Architectuur van de door de onderzoekers voorgestelde encoder. Krediet:Roy &Grangier.

In recente jaren, onderzoekers hebben geprobeerd methoden te ontwikkelen voor automatische parafrasering, wat in wezen de geautomatiseerde abstractie van semantische inhoud uit tekst inhoudt. Tot dusver, benaderingen die afhankelijk zijn van machinevertaling (MT) technieken zijn bijzonder populair gebleken vanwege het gebrek aan beschikbare gelabelde datasets van geparafraseerde paren.

theoretisch, vertaaltechnieken lijken misschien effectieve oplossingen voor automatische parafrasering, omdat ze semantische inhoud abstraheren van de taalkundige realisatie ervan. Bijvoorbeeld, het toewijzen van dezelfde zin aan verschillende vertalers kan resulteren in verschillende vertalingen en een rijke reeks interpretaties, die nuttig kunnen zijn bij het parafraseren van taken.

Hoewel veel onderzoekers op vertalingen gebaseerde methoden hebben ontwikkeld voor geautomatiseerde parafrasering, mensen hoeven niet per se tweetalig te zijn om zinnen te parafraseren. Op basis van deze observatie, twee onderzoekers van Google Research hebben onlangs een nieuwe parafraseringstechniek voorgesteld die niet afhankelijk is van machinale vertaalmethoden. In hun krant voorgepubliceerd op arXiv, ze vergeleken hun eentalige aanpak met andere parafraseringstechnieken:een begeleide vertaling en een onbegeleide vertaalaanpak.

"Dit werk stelt voor om parafraseringsmodellen te leren van alleen een niet-gelabeld eentalig corpus, "Aurko Roy en David Grangier, de twee onderzoekers die het onderzoek uitvoerden, schreven in hun krant. "Daartoe, we stellen een resterende variant voor van vector-gekwantiseerde variatie-auto-encoder."

Het door de onderzoekers geïntroduceerde model is gebaseerd op vector-gekwantiseerde auto-encoders (VQ-VAE) die zinnen kunnen parafraseren in een puur eentalige setting. Het heeft ook een uniek kenmerk (d.w.z. resterende verbindingen parallel aan de gekwantiseerde bottleneck), wat een betere controle over de decoder-entropie mogelijk maakt en optimalisatie vergemakkelijkt.

"Vergeleken met continue auto-encoders, onze methode maakt het mogelijk om diverse, maar semantisch sluit zinnen uit een invoerzin, " legden de onderzoekers uit in hun paper.

In hun studie hebben Roy en Grangier vergeleken de prestaties van hun model met die van andere op MT gebaseerde benaderingen voor parafrase-identificatie, generatie en opleidingsvergroting. Ze vergeleken het specifiek met een begeleide vertaalmethode die was getraind op parallelle tweetalige gegevens en een onbewaakte vertaalmethode die was getraind op niet-parallelle tekst in twee verschillende talen. hun voorbeeld, anderzijds, vereist alleen niet-gelabelde gegevens in één taal, degene waarin het zinnen parafraseert.

De onderzoekers ontdekten dat hun eentalige aanpak bij alle taken beter presteerde dan niet-gecontroleerde vertaaltechnieken. Vergelijkingen tussen hun model en begeleide vertaalmethoden, anderzijds, leverde gemengde resultaten op:de eentalige aanpak presteerde beter bij identificatie- en augmentatietaken, terwijl de gesuperviseerde vertaalmethode superieur was voor het genereren van parafrasen.

"Algemeen, we hebben aangetoond dat eentalige modellen beter kunnen presteren dan tweetalige modellen voor parafrase-identificatie en data-augmentatie door parafrasering, " concludeerden de onderzoekers. "We hebben ook gemeld dat de generatiekwaliteit van eentalige modellen hoger kan zijn dan modellen op basis van niet-gecontroleerde vertaling, maar niet onder toezicht vertaling."

De bevindingen van Roy en Grangier suggereren dat het gebruik van tweetalige parallelle gegevens (d.w.z. teksten en hun mogelijke vertalingen in andere talen) bijzonder voordelig is bij het genereren van parafrasen en tot opmerkelijke prestaties leidt. In situaties waar tweetalige gegevens niet direct beschikbaar zijn, echter, het door hen voorgestelde eentalige model zou een nuttige hulpbron of alternatieve oplossing kunnen zijn.

© 2019 Wetenschap X Netwerk