Project

FlemBench: Benchmarking voor Vlaamse Large Language Models - Een benchmarkinitiatief voor taal- en cultuurgevoelige AI in Vlaanderen

Code

174M03425

Looptijd

10-11-2025 → 09-11-2026

Promotor-woordvoerder

Veronique Hoste

Onderzoeksdisciplines

Humanities and the arts
- Computational linguistics
Engineering and technology
- Audio and speech computing

Trefwoorden

Benchmark Grote Taalmodellen (LLMs)

Projectomschrijving

De opmars van grootschalige taalmodellen (LLMs) creëert nieuwe kansen voor digitale innovatie, maar doet tegelijk fundamentele vragen rijzen over culturele representatie en taalsensitiviteit. Binnen de ontwikkeling en evaluatie van Nederlandstalige taaltechnologie blijven de Vlaamse variëteiten van het Nederlands ondervertegenwoordigd in bestaande benchmarks, taalmodellen en datasets. FlemBench wil daarom een cultuurgevoelige benchmark ontwikkelen die Vlaamse taal- en cultuurkenmerken expliciet meeneemt in de evaluatie van taalmodellen. Voortbouwend op internationale kaders voor cultureel inclusieve taaltechnologie (Adilazuarda et al., 2024), operationaliseert FlemBench de Vlaamse culturele context via demografische en semantische proxies door datasets te creëren die verankerd zijn in Vlaams-specifieke content. Zo faciliteert dit project de ontwikkeling van lokaal robuuste en cultureel verankerde taalmodellen voor publieke en private toepassingen in Vlaanderen, in lijn met het huidige Vlaamse AI- en mediabeleid.