Project

Gesproken Corpus van de Zuidelijk-Nederlandse Dialecten (GCND)

Code
319300220
Looptijd
01-05-2020 → 30-04-2024
Financiering
Fonds voor Wetenschappelijk Onderzoek - Vlaanderen (FWO)
Onderzoeksdisciplines
  • Humanities
    • Corpus linguistics
    • Diachronic linguistics
    • Dialectology
    • Grammar
    • Historical linguistics
    • Morphology
    • Sociolinguistics
    • Syntax
Trefwoorden
dialectologie dialecten zuidelijk Nederlandse dialecten corpus corpuslinguïstiek
 
Projectomschrijving

Het GCND is het eerste corpus van gesproken Nederlandse dialecten. Het project beoogt de ontsluiting van een unieke collectie van dialectopnames uit 768 plaatsen in België, Frankrijk en het zuiden van Nederland, waarvan 740 opgenomen tussen 1963 en 1976, bij in het algemeen weinig mobiele en laagopgeleide sprekers geboren rond 1900. Voor het GCND worden de opnames volgens een nieuw ontwikkeld transcriptieprotocol getranscribeerd – hoogdringend in tijden van snel vorderend dialectverlies! – om vervolgens met bestaande tools taalkundig verrijkt te worden met informatie over de woordsoort van de individuele woorden (‘pos-tags’) en over de syntactische functies van de woordgroepen (‘parsing’). In vergelijking met bestaande datacollecties over de Nederlandse dialecten is het GCND uniek omdat het alleen spontane spraak bevat. Aangezien de dialectopnames een historisch stadium van de taal representeren (in het geval van het Frans-Vlaams zelfs de laatste getuigenissen van een inmiddels nagenoeg uitgestorven taalvariëteit) en de opnames nu eindelijk doorzoekbaar zullen worden, zal het GCND het mogelijk maken (i) taalveranderingsprocessen geografisch in kaart te brengen, (ii) de functionaliteit van dialectkenmerken kwantitatief te onderzoeken en (iii) nieuwe, voorheen onopgemerkte en dus onbevraagde structuren op te sporen. Audio, transcripties en annotaties worden vrij online beschikbaar en doorzoekbaar gemaakt. Het GCND zal zo een historisch dialectcorpus zonder weerga vormen.