-
Natural sciences
- Applied mathematics in specific fields
Het TExSIS Project wil een volautomatisch terminologie-extractiesysteem bouwen dat on-the-fly termen extraheert uit mono- en multilinguale documenten. De architectuur is grotendeels taalonafhankelijk opgebouwd, en wordt tijdens het Project verder uitgewerkt voor het Nederlands, Frans, Duits en Engels. TExSIS wordt aangeboden in een krachtige client-serverarchitectuur, kan verschillende input- en outputformaten aan en kan zowel volautomatisch als semi-automatisch draaien. Het Project zal een open source prototype terminologie-extractor opleveren dat door softwareontwikkelaars verder gecustomizeerd en geïmplementeerd kan worden bij de eindgebruikers. Het zal leiden tot een reductie van de implementatiekost van machinevertaling, een reductie van het manuele correctiewerk bij machinevertaling, de automatische productie van monolinguale en multilinguale woordenboeken, een automatisering van consistentiechecks, de automatische productie van thesauri voor bestaande archieven, het automatisch metadateren van documenten en het versneld doorzoeken van grote archieven en databanken. Dit concrete nut wordt tijdens het Project aangetoond in twee use cases die een brede groep van gebruikers afdekken: machinevertaling en information retrieval.