Project

Samenstellen en opzetten van FlemBench: Benchmarking voor Vlaamse Large Language Models - Een benchmarkinitiatief voor taal- en cultuurgevoelige AI in Vlaanderen

Code
174M03425
Looptijd
10-11-2025 → 09-11-2026
Promotor-woordvoerder
Onderzoeksdisciplines
  • Humanities and the arts
    • Computational linguistics
  • Engineering and technology
    • Audio and speech computing
Trefwoorden
Benchmark Grote Taalmodellen (LLMs)
 
Projectomschrijving

De opmars van grootschalige taalmodellen (LLMs) creëert nieuwe kansen voor digitale innovatie, maar doet tegelijk fundamentele vragen rijzen over culturele representatie en taalsensitiviteit. Binnen de ontwikkeling en evaluatie van Nederlandstalige taaltechnologie blijven de Vlaamse variëteiten van het Nederlands ondervertegenwoordigd in bestaande benchmarks, taalmodellen en datasets. FlemBench wil daarom een cultuurgevoelige benchmark ontwikkelen die Vlaamse taal- en cultuurkenmerken expliciet meeneemt in de evaluatie van taalmodellen. Voortbouwend op internationale kaders voor cultureel inclusieve taaltechnologie (Adilazuarda et al., 2024), operationaliseert FlemBench de Vlaamse culturele context via demografische en semantische proxies door datasets te creëren die verankerd zijn in Vlaams-specifieke content.  Zo faciliteert dit project de ontwikkeling van lokaal robuuste en cultureel verankerde taalmodellen voor publieke en private toepassingen in Vlaanderen, in lijn met het huidige Vlaamse AI- en mediabeleid.