-
Natural sciences
- Natural language processing
-
Engineering and technology
- Audio and speech processing
- Pattern recognition and neural networks
- Audio and speech computing
NeLF beoogt state-of-the-art automatische spraakherkenningstechnologie te ontwikkelen waarvoor geen enorme
hoeveelheden manueel getranscribeerde spraak vereist zijn. In de plaats daarvan willen we vooral inzetten op slimmer opgebouwde modellen in combinatie met een raamwerk van zelfleren en ongesuperviseerd leren zodat ook goedkope ongetranscribeerde of zwak geannoteerde data optimaal kan ingezet worden. Een dergelijke aanpak die berust op
technische expertise en slimme algoritmen i.p.v. dure annotatieinspanningen is een goede oplossing voor de Vlaamse markt,
die divers is m.b.t. dialecten en spraak van anderstaligen, die met6 miljoen sprekers relatief klein is, en een veelheid aan use cases in verschillende industrieën heeft. Door gebruik te maken van de technologische kennis in Vlaanderen, gecombineerd met een inspanning om spraakdata beschikbaar te maken, kan de waardeketting gevoed worden met kostenefficiënte oplossingen op maat, inclusief oplossingen voor KMO’s en (niet) gouvernementele organisaties. Onze
onderzoeksresultaten zijn ook toepasbaar op andere (Europese) landen met een gelijkaardige talige variatie en markt (Zwitserland, Frankrijk, Italië, Polen, …). De projectresultaten bevatten (1) open source tools en publicaties die de onderliggende technologie beschrijven, (2) een publiek corpus van spraak en (pseudo-)annotaties, met focus op de uitdagende spraak zoals spontane, dialectische en anderstalige spraak, (3) een privaat corpus dat enkel toegankelijk is voor onderzoek door vertrouwde partijen, (4) een webservice die burgers, ondernemingen en organisaties toelaat
spraakmateriaal te doneren voor beide corpora, (5) modellen voor opensource spraakherkenners die beschikbaar zijn voor lokale ondernemingen, (6) webservices gebouwd met deze modellen en tools die een laagdrempelige automatische spraakherkenning van hoge kwaliteit aanbieden.