-
Natural sciences
- Information technologies
-
Humanities and the arts
- Greek language
- Latin language
- Computational linguistics
Formulaire teksten vormen een kerninteresse van onderzoekers aan de UGent. In de sectie Grieks lopen er momenteel twee grote projecten over dergelijke genres: een ERC-project over 'dagdagelijkse' teksten, en een GOA-project over poëtische parateksten die Byzantijnse manuscripten vergezellen. Daarnaast worden andere formulaire teksten, zoals inscripties, onderzocht door individuele onderzoekers die werken op Grieks en andere talen, zoals Latijn, Arabisch, Koptisch en middeleeuws Italiaans. In verschillende mate combineren deze projecten een meer traditionele, handmatige annotatiebenadering met innovatieve, computationele annotatiemethodes. We willen nu een meertalig, multimodaal en door machine learning aangedreven annotatieplatform ontwikkelen dat (i) handmatige annotatie en validatie van automatische annotatie mogelijk maakt, door middel van communicatie met API's die machine learning-modellen integreren, (ii) onderzoekers in staat stelt om maximaal te profiteren van elkaars expertise en technologische kennis, wat innovatieve onderzoeksbenaderingen en snellere, betrouwbaardere en uitgebreidere annotatie van corpora stimuleert, (iii) samenwerking bevordert tussen onderzoekers die werken aan verschillende historische corpora/talen en binnen verschillende disciplines, en (iv) een gebruiksvriendelijke onderzoeksomgeving biedt die gegevens kan terugkoppelen naar bestaande projectdatabases, terwijl het ook open staat voor kleinere onderzoeksprojecten en individuele onderzoekers.