Project

NeLF: Naar een volgend niveau voor Vlaamse automatische sprraakherkenning.

Code

3S004923

Looptijd

01-10-2022 → 30-09-2026

Financiering

Fonds voor Wetenschappelijk Onderzoek - Vlaanderen (FWO)

Promotor

Kris Demuynck

Onderzoeksdisciplines

Natural sciences
- Natural language processing
Engineering and technology
- Audio and speech processing
- Pattern recognition and neural networks
- Audio and speech computing

Trefwoorden

Informatie en communicatie technologie big data artificiële intelligentie data sciences automatische spraakherkenning Zwak begeleid machine learning Zwak begeleid machine learning Informatie- en communicatietechnologie

Projectomschrijving

NeLF beoogt state-of-the-art automatische spraakherkenningstechnologie te ontwikkelen waarvoor geen enorme

hoeveelheden manueel getranscribeerde spraak vereist zijn. In de plaats daarvan willen we vooral inzetten op slimmer opgebouwde modellen in combinatie met een raamwerk van zelfleren en ongesuperviseerd leren zodat ook goedkope ongetranscribeerde of zwak geannoteerde data optimaal kan ingezet worden. Een dergelijke aanpak die berust op

technische expertise en slimme algoritmen i.p.v. dure annotatieinspanningen is een goede oplossing voor de Vlaamse markt,

die divers is m.b.t. dialecten en spraak van anderstaligen, die met6 miljoen sprekers relatief klein is, en een veelheid aan use cases in verschillende industrieën heeft. Door gebruik te maken van de technologische kennis in Vlaanderen, gecombineerd met een inspanning om spraakdata beschikbaar te maken, kan de waardeketting gevoed worden met kostenefficiënte oplossingen op maat, inclusief oplossingen voor KMO’s en (niet) gouvernementele organisaties. Onze

onderzoeksresultaten zijn ook toepasbaar op andere (Europese) landen met een gelijkaardige talige variatie en markt (Zwitserland, Frankrijk, Italië, Polen, …). De projectresultaten bevatten (1) open source tools en publicaties die de onderliggende technologie beschrijven, (2) een publiek corpus van spraak en (pseudo-)annotaties, met focus op de uitdagende spraak zoals spontane, dialectische en anderstalige spraak, (3) een privaat corpus dat enkel toegankelijk is voor onderzoek door vertrouwde partijen, (4) een webservice die burgers, ondernemingen en organisaties toelaat

spraakmateriaal te doneren voor beide corpora, (5) modellen voor opensource spraakherkenners die beschikbaar zijn voor lokale ondernemingen, (6) webservices gebouwd met deze modellen en tools die een laagdrempelige automatische spraakherkenning van hoge kwaliteit aanbieden.