Project

Verbetering van neurale machinevertaalsystemen door retrieval-gebaseerde methodes

Code
BOF/STA/202302/013
Looptijd
01-08-2023 → 31-07-2027
Financiering
Gewestelijke en gemeenschapsmiddelen: Bijzonder Onderzoeksfonds
Promotor
Onderzoeksdisciplines
  • Natural sciences
    • Machine learning and decision making
    • Natural language processing
  • Humanities and the arts
    • Translation studies
    • Interpreting studies
Trefwoorden
Vertaalgeheugen Natuurlijke taalverwerking Neurale machinevertaling
 
Projectomschrijving

Retrieval-gebaseerde methodes voor natuurlijke taalverwerking (NLP) hebben als doel neurale modellen te verbeteren door tijdens training en/of interferentie teksten op te zoeken  die overeenkomsten vertonen met een gegeven invoer. In de context van neurale machinevertaling (NMT) hebben retrieval-gebaseerde methodes geleid tot indrukwekkende verbeteringen in de vertaalkwaliteit door gelijksoortige vertalingen te integreren in de NMT-architectuur (i) door het aandachtsmechanisme aan te passen,  (ii) als extra netwerkcomponenten of (iii) via een data-uitbreidingsmethode. 

Door hun vermogen om gelijksoortige vertalingen effectief te gebruiken, kan RBNMT worden gezien als een sprong voorwaarts in de integratie van NMT en vertaalgeheugensystemen (TM), die vaak worden gebruikt in de computerondersteunde vertaalworkflows, waardoor het onderscheid tussen de twee technologieën vervaagt. Dit project is gericht op het gebruik van geavanceerde NLP-methodes om NMT-systemen en TM-NMT-integratiestrategieën verder te verbeteren.