-
Humanities and the arts
- Computational linguistics
-
Engineering and technology
- Audio and speech computing
De opmars van grootschalige taalmodellen (LLMs) creëert nieuwe kansen voor digitale innovatie, maar doet tegelijk fundamentele vragen rijzen over culturele representatie en taalsensitiviteit. Binnen de ontwikkeling en evaluatie van Nederlandstalige taaltechnologie blijven de Vlaamse variëteiten van het Nederlands ondervertegenwoordigd in bestaande benchmarks, taalmodellen en datasets. FlemBench wil daarom een cultuurgevoelige benchmark ontwikkelen die Vlaamse taal- en cultuurkenmerken expliciet meeneemt in de evaluatie van taalmodellen. Voortbouwend op internationale kaders voor cultureel inclusieve taaltechnologie (Adilazuarda et al., 2024), operationaliseert FlemBench de Vlaamse culturele context via demografische en semantische proxies door datasets te creëren die verankerd zijn in Vlaams-specifieke content. Zo faciliteert dit project de ontwikkeling van lokaal robuuste en cultureel verankerde taalmodellen voor publieke en private toepassingen in Vlaanderen, in lijn met het huidige Vlaamse AI- en mediabeleid.