Project

HiDD – Historische Dialectendatabase

Code

31501420

Looptijd

01-01-2020 → 30-06-2021

Financiering

Fonds voor Wetenschappelijk Onderzoek - Vlaanderen (FWO)

Promotor

Melissa Farasyn

Onderzoeksdisciplines

Humanities and the arts
- Computational linguistics
- Corpus linguistics
- Diachronic linguistics
- Dialectology
- Historical linguistics

Trefwoorden

dialecten Taalkunde

Projectomschrijving

Dit project betreft de ontwikkeling van een historische dialectendatabase van de Vlaamse dialecten voor het bestuderen van dialectsyntaxis. De betrokken dataset maakt deel uit van de oudste mondeling geënquêteerde dialectcollectie in het taalgebied tussen 1923 en 1982, sprekers van 1956 locaties in de Nederlandse en Friese taal vertaalde 141 zinnen in hun lokale dialecten. Ze werden opgeschreven in fonetisch schrift door getrainde taalkundigen en gepubliceerd in atlassen. De gegevens zijn gedigitaliseerd als pdf's, maar zijn niet gemakkelijk doorzoekbaar, aangezien men handmatig naar elke zin in de 16 atlassen moet zoeken. Verder , de gegevens kunnen tegenwoordig niet worden gebruikt door internationale onderzoekers zonder kennis van de lokale dialecten of door leken die niet in staat zijn om het fonetisch schrift te lezen
De voorgestelde database bevat 541 van de 1956 locaties. Het zal mogelijk zijn om door de gegevens te zoeken met filters zoals leeftijd, geslacht, locatie en zinsnummer, of meer geavanceerd op basis van het deel van de speech-tag. De fonetische tekens worden vertaald in een orthografische
weergave in twee lagen: een dicht bij het dialect (1a) en een dicht bij het Nederlands (1b)

(1) a an d # ennen e steekvogel zien z # em benauwd
b als de hennen een steekvogel zien ze hebben benauwd
"" Als de kippen een mus havik zien, zijn ze bang "(zin 1, De Moeren)

Het doel is om onderzoek naar dialectologische variatie in syntaxis te vergemakkelijken om studies te informeren over (redenen achter) taalverandering en theoretische representaties van taal