Project

Ontwikkelen van een meertalige, multimodale en door machine learning aangedreven annotatie-infrastructuur voor de analyse, creatie, verrijking en interculturele vergelijking van historische formulaire tekst-corpora

Acroniem
ANNOPHIS
Code
I005524N
Looptijd
01-05-2024 → 30-04-2028
Financiering
Fonds voor Wetenschappelijk Onderzoek - Vlaanderen (FWO)
Promotor-woordvoerder
Onderzoeksdisciplines
  • Humanities
    • Greek language
    • Latin language
    • Computational linguistics
  • Natural sciences
    • Information technologies
Trefwoorden
historische formulaire tekst-corpora
 
Projectomschrijving

Formulaire teksten vormen een kerninteresse van onderzoekers aan de UGent. In de sectie Grieks lopen er momenteel twee grote projecten over dergelijke genres: een ERC-project over 'dagdagelijkse' teksten, en een GOA-project over poëtische parateksten die Byzantijnse manuscripten vergezellen. Daarnaast worden andere formulaire teksten, zoals inscripties, onderzocht door individuele onderzoekers die werken op Grieks en andere talen, zoals Latijn, Arabisch, Koptisch en middeleeuws Italiaans. In verschillende mate combineren deze projecten een meer traditionele, handmatige annotatiebenadering met innovatieve, computationele annotatiemethodes. We willen nu een meertalig, multimodaal en door machine learning aangedreven annotatieplatform ontwikkelen dat (i) handmatige annotatie en validatie van automatische annotatie mogelijk maakt, door middel van communicatie met API's die machine learning-modellen integreren, (ii) onderzoekers in staat stelt om maximaal te profiteren van elkaars expertise en technologische kennis, wat innovatieve onderzoeksbenaderingen en snellere, betrouwbaardere en uitgebreidere annotatie van corpora stimuleert, (iii) samenwerking bevordert tussen onderzoekers die werken aan verschillende historische corpora/talen en binnen verschillende disciplines, en (iv) een gebruiksvriendelijke onderzoeksomgeving biedt die gegevens kan terugkoppelen naar bestaande projectdatabases, terwijl het ook open staat voor kleinere onderzoeksprojecten en individuele onderzoekers.