Code
bof/baf/4y/2024/01/239
Looptijd
01-01-2024 → 31-12-2025
Financiering
Gewestelijke en gemeenschapsmiddelen: Bijzonder Onderzoeksfonds
Promotor
Onderzoeksdisciplines
-
Humanities and the arts
- Corpus linguistics
- Diachronic linguistics
- Sociolinguistics
Trefwoorden
Gesproken Nederlands
corpusopbouw
taalvariatie
Projectomschrijving
Het DIRT-corpus (corpus Dutch in reality-tv) is een corpus dat bestaat uit informeel gesproken Belgisch Nederlandse en Nederlands Nederlandse taal uit reality-tv. DIRT is een groeiend corpus, dat regelmatig wordt aangevuld met nieuw materiaal. De eerste versie van het DIRT-corpus werd gecreëerd door Ulrike Vogl en Gauthier Delaby in 2021. In totaal telt het corpus momenteel ca. 200.000 woorden. De transcripties werden tot nu toe gemaakt door jobstudenten en studenten uit de ba3-onderzoekslijn “Taalgebruik in reality-tv” in Academiejaar 21-22. In de komende jaren willen we het corpus uitbouwen en bovendien zorgen voor continuïteit door een vervolgproject aan te vragen. De geplande uitbouw heeft betrekking op de volgende aspecten: we zullen (1) meer metadata toevoegen (bijv. naast nationaliteit, leeftijd, provincie/woonplaats, beroep en geslacht van de spreker ook talenkennis, verblijf in het buitenland), (2) oudere seizoenen van reality-tv transcriberen om ook diachroon taalkundig onderzoek op basis van DIRT mogelijk te maken en (3) meer Nederlands Nederlandse reality-programma's transcriberen om voor meer evenwicht te zorgen binnen het Nederlandse taalgebied. Hiervoor stellen we een medewerker aan voor 40%, eerst eens voor 2 jaar. Concreet Lien Hellebaut die o.a. de volgende taken zal hebben: transcriberen , transcripties aanvullen, transcriptieprotocol verfijnen, metadata annoteren, disseminatie (website), meewerken aan projectaanvraag.