Project

Dynamische aanpassing van neurale automatische vertaalsystemen met behulp van/aan de hand van voorbeelden

Code

3E006920

Looptijd

01-10-2020 → 30-09-2023

Financiering

Fonds voor Wetenschappelijk Onderzoek - Vlaanderen (FWO)

Promotor

Lieve Macken

Onderzoeksdisciplines

Natural sciences
- Machine learning and decision making
- Natural language processing
Humanities and the arts
- Computational linguistics
- Translation studies
- Interpreting studies

Trefwoorden

neurale machinevertaling vertaalvoorbeelden Taaltechnologie Vertaalkunde kwaliteitsbeoordeling van automatische vertalingen. Taalkunde

Projectomschrijving

De kwaliteit van automatische vertalingen is toegenomen door recente ontwikkelingen in neurale machinevertaling (NMT). Deze ontwikkelingen motiveerden onderzoekers om de modellen van het menselijke vertaalproces te herzien. NMT-systemen kunnen regel-gebaseerd taalgedrag nabootsen maar toch hebben ze de neiging om te overgeneraliseren en om zeldzame vertaalpatronen te vergeten. Uit onderzoek blijkt dat de kwaliteit van NMT verbeterd kan worden door het toevoegen van vertaalvoorbeelden in de architectuur van het NMT-systeem. Deze verbeteringen in vertaalkwaliteit roepen nieuwe onderzoeksvragen op over de rol die voorbeelden spelen in MT. Een voorbeeld hiervan is het belang van tekst-gebaseerde semantische en syntactische gelijkheidsmetrieken voor het vinden van nuttige voorbeelden, dewelke kunnen worden overgedragen naar het menselijke vertaalproces en taalgedrag. In dit onderzoeksvoorstel wordt methodologie uit de computationele linguïstiek gebruikt (i) om de impact van het aanpassen van NMT-systemen met voorbeelden te bestuderen; (ii) om de rol van verschillende gelijkheidsniveau’s te bepalen bij het zoeken naar voorbeelden (bv. tekst-gebaseerd, semantisch, en syntactisch); (iii) om te onderzoeken of verbeteringen in vertaalkwaliteit kunnen worden waargenomen in verschillende domeinen, taalparen; en (iv) om na te gaan of vertaalvoorbeelden gebruikt kunnen worden om NMT-systemen die getraind werden op data uit het algemene domein, aan te passen aan een specifiek domein.