Project

Terminologie-extractie voor semantische interoperabiliteit en standaardisatie .

Acroniem

TExSIS

Code

179J5611

Looptijd

01-01-2011 → 31-12-2012

Financiering

Gewestelijke en gemeenschapsmiddelen: IWT/VLAIO

Promotor

Filip De Turck

Onderzoeksdisciplines

Natural sciences
- Applied mathematics in specific fields

Trefwoorden

terminologie-extractiesysteem Vertaalkunde Taaltechnologie

Projectomschrijving

Het TExSIS Project wil een volautomatisch terminologie-extractiesysteem bouwen dat on-the-fly termen extraheert uit mono- en multilinguale documenten. De architectuur is grotendeels taalonafhankelijk opgebouwd, en wordt tijdens het Project verder uitgewerkt voor het Nederlands, Frans, Duits en Engels. TExSIS wordt aangeboden in een krachtige client-serverarchitectuur, kan verschillende input- en outputformaten aan en kan zowel volautomatisch als semi-automatisch draaien. Het Project zal een open source prototype terminologie-extractor opleveren dat door softwareontwikkelaars verder gecustomizeerd en geïmplementeerd kan worden bij de eindgebruikers. Het zal leiden tot een reductie van de implementatiekost van machinevertaling, een reductie van het manuele correctiewerk bij machinevertaling, de automatische productie van monolinguale en multilinguale woordenboeken, een automatisering van consistentiechecks, de automatische productie van thesauri voor bestaande archieven, het automatisch metadateren van documenten en het versneld doorzoeken van grote archieven en databanken. Dit concrete nut wordt tijdens het Project aangetoond in twee use cases die een brede groep van gebruikers afdekken: machinevertaling en information retrieval.