Project

NeLF: Naar een volgend niveau voor Vlaamse automatische sprraakherkenning.

Code
3S004923
Looptijd
01-10-2022 → 30-09-2026
Financiering
Fonds voor Wetenschappelijk Onderzoek - Vlaanderen (FWO)
Onderzoeksdisciplines
  • Natural sciences
    • Natural language processing
  • Engineering and technology
    • Audio and speech processing
    • Pattern recognition and neural networks
    • Audio and speech computing
Trefwoorden
Informatie en communicatie technologie big data artificiële intelligentie data sciences automatische spraakherkenning Zwak begeleid machine learning Zwak begeleid machine learning Informatie- en communicatietechnologie
 
Projectomschrijving

NeLF beoogt state-of-the-art automatische spraakherkenningstechnologie te ontwikkelen waarvoor geen enorme

hoeveelheden manueel getranscribeerde spraak vereist zijn. In de plaats daarvan willen we vooral inzetten op slimmer opgebouwde modellen in combinatie met een raamwerk van zelfleren en ongesuperviseerd leren zodat ook goedkope ongetranscribeerde of zwak geannoteerde data optimaal kan ingezet worden. Een dergelijke aanpak die berust op

technische expertise en slimme algoritmen i.p.v. dure annotatieinspanningen is een goede oplossing voor de Vlaamse markt,

die divers is m.b.t. dialecten en spraak van anderstaligen, die met6 miljoen sprekers relatief klein is, en een veelheid aan use cases in verschillende industrieën heeft. Door gebruik te maken van de technologische kennis in Vlaanderen, gecombineerd met een inspanning om spraakdata beschikbaar te maken, kan de waardeketting gevoed worden met kostenefficiënte oplossingen op maat, inclusief oplossingen voor KMOs en (niet) gouvernementele organisaties. Onze

onderzoeksresultaten zijn ook toepasbaar op andere (Europese) landen met een gelijkaardige talige variatie en markt (Zwitserland, Frankrijk, Italië, Polen, ). De projectresultaten bevatten (1) open source tools en publicaties die de onderliggende technologie beschrijven, (2) een publiek corpus van spraak en (pseudo-)annotaties, met focus op de uitdagende spraak zoals spontane, dialectische en anderstalige spraak, (3) een privaat corpus dat enkel toegankelijk is voor onderzoek door vertrouwde partijen, (4) een webservice die burgers, ondernemingen en organisaties toelaat

spraakmateriaal te doneren voor beide corpora, (5) modellen voor opensource spraakherkenners die beschikbaar zijn voor lokale ondernemingen, (6) webservices gebouwd met deze modellen en tools die een laagdrempelige automatische spraakherkenning van hoge kwaliteit aanbieden.