Project

Verbetering van neurale machinevertaalsystemen door retrieval-gebaseerde methodes

Code

BOF/STA/202302/013

Looptijd

01-08-2023 → 31-07-2027

Financiering

Gewestelijke en gemeenschapsmiddelen: Bijzonder Onderzoeksfonds

Promotor

Arda Tezcan

Onderzoeksdisciplines

Natural sciences
- Machine learning and decision making
- Natural language processing
Humanities and the arts
- Translation studies
- Interpreting studies

Trefwoorden

Vertaalgeheugen Natuurlijke taalverwerking Neurale machinevertaling

Projectomschrijving

Retrieval-gebaseerde methodes voor natuurlijke taalverwerking (NLP) hebben als doel neurale modellen te verbeteren door tijdens training en/of interferentie teksten op te zoeken die overeenkomsten vertonen met een gegeven invoer. In de context van neurale machinevertaling (NMT) hebben retrieval-gebaseerde methodes geleid tot indrukwekkende verbeteringen in de vertaalkwaliteit door gelijksoortige vertalingen te integreren in de NMT-architectuur (i) door het aandachtsmechanisme aan te passen, (ii) als extra netwerkcomponenten of (iii) via een data-uitbreidingsmethode.

Door hun vermogen om gelijksoortige vertalingen effectief te gebruiken, kan RBNMT worden gezien als een sprong voorwaarts in de integratie van NMT en vertaalgeheugensystemen (TM), die vaak worden gebruikt in de computerondersteunde vertaalworkflows, waardoor het onderscheid tussen de twee technologieën vervaagt. Dit project is gericht op het gebruik van geavanceerde NLP-methodes om NMT-systemen en TM-NMT-integratiestrategieën verder te verbeteren.