Project

Automatische detectie van (mogelijke) brontekstfactoren die in automatische vertaling tot gender bias kunnen leiden

Code
DOCT/011451
Looptijd
21-11-2023 → 21-09-2025 (Lopend)
Doctoraal onderzoeker
Onderzoeksdisciplines
  • Natural sciences
    • Natural language processing
    • Communication networks
  • Humanities and the arts
    • Comparative language studies
    • Morphology
    • Semantics
Trefwoorden
Vertaalkunde gender bias automatische vertaalsystemen Taaltechnologie
 
Projectomschrijving

Nu de vraag naar genderinclusiviteit in de maatschappij steeds groter wordt, wordt er ook vaker onderzocht hoe vooroordelen (bv. gendervooroordelen of gender bias) versterkt worden door technologie, zoals bij automatische vertaalsystemen (machine translation of MT). Tot dusver keken onderzoekers hierbij hoofdzakelijk naar vooraf bepaalde categorieën of woordsoorten (bv. beroepen). Met dit onderzoeksvoorstel introduceren we een nieuwe aanpak voor het onderzoek naar gender bias in MT door te vertrekken van een brontekstanalyse. Het doel is om een detectiesysteem te ontwikkelen dat automatisch elementen in een brontekst kan herkennen die een invloed zullen hebben op het woordgeslacht dat door een MT-systeem geselecteerd zal worden (en dus mogelijk tot gender bias kunnen leiden). Concreet gaat het om een machine learning-model dat getraind zal worden op basis van manueel geannoteerde teksten (a.d.h.v. een taxonomie die in het kader van dit onderzoek ontwikkeld zal worden) en morfosyntactische informatie. Het doel is om een methode te ontwikkelen die ervoor kan zorgen dat door AI-aangedreven technologieën (zoals MT) genderinclusiever worden, net als de maatschappij.