Project

Dynamische aanpassing van neurale automatische vertaalsystemen met behulp van/aan de hand van voorbeelden

Code
3E006920
Looptijd
01-10-2020 → 30-09-2023
Financiering
Fonds voor Wetenschappelijk Onderzoek - Vlaanderen (FWO)
Mandaathouder
Onderzoeksdisciplines
  • Humanities
    • Computational linguistics
    • Translation and interpretation sciences
  • Natural sciences
    • Machine learning and decision making
    • Natural language processing
Trefwoorden
neurale machinevertaling vertaalvoorbeelden Taaltechnologie Vertaalkunde kwaliteitsbeoordeling van automatische vertalingen. Taalkunde
 
Projectomschrijving

De kwaliteit van automatische vertalingen is toegenomen door recente ontwikkelingen in neurale machinevertaling (NMT). Deze ontwikkelingen motiveerden onderzoekers om de modellen van het menselijke vertaalproces te herzien. NMT-systemen kunnen regel-gebaseerd taalgedrag nabootsen maar toch hebben ze de neiging om te overgeneraliseren en om zeldzame vertaalpatronen te vergeten. Uit onderzoek blijkt dat de kwaliteit van NMT verbeterd kan worden door het toevoegen van vertaalvoorbeelden in de architectuur van het NMT-systeem. Deze verbeteringen in vertaalkwaliteit roepen nieuwe onderzoeksvragen op over de rol die voorbeelden spelen in MT. Een voorbeeld hiervan is het belang van tekst-gebaseerde semantische en syntactische gelijkheidsmetrieken voor het vinden van nuttige voorbeelden, dewelke kunnen worden overgedragen naar het menselijke vertaalproces en taalgedrag. In dit onderzoeksvoorstel wordt methodologie uit de computationele linguïstiek gebruikt (i) om de impact van het aanpassen van NMT-systemen met voorbeelden te bestuderen; (ii) om de rol van verschillende gelijkheidsniveau’s te bepalen bij het zoeken naar voorbeelden (bv. tekst-gebaseerd, semantisch, en syntactisch); (iii) om te onderzoeken of verbeteringen in vertaalkwaliteit kunnen worden waargenomen in verschillende domeinen, taalparen; en (iv) om na te gaan of vertaalvoorbeelden gebruikt kunnen worden om NMT-systemen die getraind werden op data uit het algemene domein, aan te passen aan een specifiek domein.