Project

NeLF: Naar een volgend niveau voor Vlaamse automatische sprraakherkenning.

Code
3S004923
Looptijd
01-10-2022 → 30-09-2026
Financiering
Fonds voor Wetenschappelijk Onderzoek - Vlaanderen (FWO)
Onderzoeksdisciplines
  • Natural sciences
    • Natural language processing
  • Engineering and technology
    • Audio and speech processing
    • Pattern recognition and neural networks
    • Audio and speech computing
Trefwoorden
Informatie en communicatie technologie
 
Projectomschrijving

NeLF beoogt state-of-the-art automatische

spraakherkenningstechnologie te ontwikkelen waarvoor geen enorme

hoeveelheden manueel getranscribeerde spraak vereist zijn. In de plaats

daarvan willen we vooral inzetten op slimmer opgebouwde modellen in

combinatie met een raamwerk van zelfleren en ongesuperviseerd leren

zodat ook goedkope ongetranscribeerde of zwak geannoteerde data

optimaal kan ingezet worden. Een dergelijke aanpak die berust op

technische expertise en slimme algoritmen i.p.v. dure

annotatieinspanningen is een goede oplossing voor de Vlaamse markt,

die divers is m.b.t. dialecten en spraak van anderstaligen, die met6

miljoen sprekers relatief klein is, en een veelheid aan use cases in

verschillende industrieën heeft. Door gebruik te maken van de

technologische kennis in Vlaanderen, gecombineerd met een inspanning

om spraakdata beschikbaar te maken, kan de waardeketting gevoed

worden met kostenefficiënte oplossingen op maat, inclusief oplossingen

voor KMOs en (niet) gouvernementele organisaties. Onze

onderzoeksresultaten zijn ook toepasbaar op andere (Europese) landen

met een gelijkaardige talige variatie en markt (Zwitserland, Frankrijk,

Italië, Polen, ).

De projectresultaten bevatten (1) open source tools en publicaties die

de onderliggende technologie beschrijven, (2) een publiek corpus van

spraak en (pseudo-)annotaties, met focus op de uitdagende spraak zoals

spontane, dialectische en anderstalige spraak, (3) een privaat corpus dat

enkel toegankelijk is voor onderzoek door vertrouwde partijen, (4) een

webservice die burgers, ondernemingen en organisaties toelaat

spraakmateriaal te doneren voor beide corpora, (5) modellen voor opensource spraakherkenners die beschikbaar zijn voor lokale

ondernemingen, (6) webservices gebouwd met deze modellen en tools

die een laagdrempelige automatische spraakherkenning van hoge

kwaliteit aanbieden.