-
Natural sciences
- Natural language processing
-
Engineering and technology
- Audio and speech processing
- Pattern recognition and neural networks
- Audio and speech computing
NeLF beoogt state-of-the-art automatische
spraakherkenningstechnologie te ontwikkelen waarvoor geen enorme
hoeveelheden manueel getranscribeerde spraak vereist zijn. In de plaats
daarvan willen we vooral inzetten op slimmer opgebouwde modellen in
combinatie met een raamwerk van zelfleren en ongesuperviseerd leren
zodat ook goedkope ongetranscribeerde of zwak geannoteerde data
optimaal kan ingezet worden. Een dergelijke aanpak die berust op
technische expertise en slimme algoritmen i.p.v. dure
annotatieinspanningen is een goede oplossing voor de Vlaamse markt,
die divers is m.b.t. dialecten en spraak van anderstaligen, die met6
miljoen sprekers relatief klein is, en een veelheid aan use cases in
verschillende industrieën heeft. Door gebruik te maken van de
technologische kennis in Vlaanderen, gecombineerd met een inspanning
om spraakdata beschikbaar te maken, kan de waardeketting gevoed
worden met kostenefficiënte oplossingen op maat, inclusief oplossingen
voor KMO’s en (niet) gouvernementele organisaties. Onze
onderzoeksresultaten zijn ook toepasbaar op andere (Europese) landen
met een gelijkaardige talige variatie en markt (Zwitserland, Frankrijk,
Italië, Polen, …).
De projectresultaten bevatten (1) open source tools en publicaties die
de onderliggende technologie beschrijven, (2) een publiek corpus van
spraak en (pseudo-)annotaties, met focus op de uitdagende spraak zoals
spontane, dialectische en anderstalige spraak, (3) een privaat corpus dat
enkel toegankelijk is voor onderzoek door vertrouwde partijen, (4) een
webservice die burgers, ondernemingen en organisaties toelaat
spraakmateriaal te doneren voor beide corpora, (5) modellen voor opensource spraakherkenners die beschikbaar zijn voor lokale
ondernemingen, (6) webservices gebouwd met deze modellen en tools
die een laagdrempelige automatische spraakherkenning van hoge
kwaliteit aanbieden.