Project

FED-tWIN - KBR Digital Research Lab: Op weg naar een KBR Digital Research Lab en kennisnetwerk voor de studie van het gedigitaliseerde en born-digital historische, literaire en culturele erfgoed van België van de 19e - 21e eeuw

Looptijd
01-02-2020 → Lopend
Financiering
Federale middelen: divers
Mandaathouder
Onderzoeksdisciplines
  • Humanities
    • Development of methods and techniques
    • Humanities and the arts not elsewhere classified
Trefwoorden
digital humanities erfgoed
 
Projectomschrijving

Het doel van het KBR Digitaal Onderzoekslab is om een ​​langdurige samenwerking tot stand te brengen tussen het Gentse Centrum voor Digitale Geesteswetenschappen (GhentCDH, dat tevens optreedt als nationaal coördinatieknooppunt van DARIAH-BE en de CLARIAH-VL Open Humanities Service Infrastructure) en de Koninklijke Bibliotheek van België (KBR) om: a) de toegang op gegevensniveau tot de gedigitaliseerde en born-digital collecties van KBR te vergemakkelijken, inclusief integratie in het bibliotheekbeheersysteem van de KBR, digitalisering en (semi) automatische creatie en verrijking van metadata-workflows, b) ervoor te zorgen dat de gedigitaliseerde en born-digital collecties worden op een gebruiksvriendelijke manier ingebed in de workflow van de onderzoeker en c) optimaliseren van de gedigitaliseerde collecties voor het gebruik van digitale onderzoekstechnieken in de geesteswetenschappen, zoals tekst- en datamining.

De Belgische regering heeft aanzienlijk geïnvesteerd in de digitalisering van de collecties van de Federale Wetenschappelijke Instellingen. De digitalisering van de KBR van de Belgische pers 1830-1950 is een vlaggenschipvoorbeeld. Hoewel de digitalisering van deze waardevolle Belgische literaire, culturele en historische erfgoedcollecties een grote prestatie is, wordt het werkelijke potentieel van deze middelen voor digitaal geesteswetenschappelijk onderzoek nog niet benut. Zonder de hulp van geavanceerde digitale methoden en gedistribueerde computerinfrastructuren is het simpelweg onmogelijk om deze grote hoeveelheid grotendeels ongestructureerde gegevens over de menselijke cultuur die - tot op zekere hoogte - opgesloten zit in tekstdocumenten, te onderzoeken en betekenis te geven.

Wat onderzoekers in een breed scala van disciplines steeds meer gemeen hebben, is dat ze de verschillende (tekstuele) brontypen samen willen onderzoeken, met een hoofdrol voor Natural Language Processing (NLP) en machine learning-methoden, zoals deep learning. NLP als een manier om tekstuele en mediagegevens te analyseren is in een stroomversnelling gekomen en er zijn veel projecten opgezet om te voldoen aan de verwachtingen van geesteswetenschappers die de enorme hoeveelheid gedigitaliseerde gegevens die beschikbaar zijn gekomen willen interpreteren. Terwijl de huidige Optical Character Recognition (OCR) en Handwritten Text Recognition (HTR) -technologieën de productie van digitale teksten voor literair en historisch onderzoek al vergemakkelijken, moeten ze verder worden ontwikkeld.

De methodologie voor de ontwikkeling van het beoogde KBR Digital Research Lab (DRL) over een periode van 10 jaar zal worden uitgevoerd op een agile en iteratieve benadering, in voortdurende dialoog met alle relevante belanghebbenden (bijv. KBR-medewerkers, in het bijzonder het KBR Senior Management Team , Digitalisering en ICT-experts, verzamelingen en catalogi, inclusief de nationale bibliografie) en (digitale) geesteswetenschappelijke onderzoekers).

Gezien de Belgische meertalige context en de daarmee gepaard gaande missie van KBR, zal meertaligheid centraal staan ​​in dit programma. Deze focus sluit aan bij de ambitie om op digitale wijze toegang te verlenen tot collecties op een state-of-the-art manier en volgens internationale standaarden die momenteel evolueren op het gebied van Digital Humanities. Het bieden van zoekfunctionaliteiten die meertalige toegang bieden tot collecties (en hun metadata), die per definitie meertalig zijn, zal een meer verkennende waarde opleveren.

Het belang van onderzoek naar wijziging van het Belgische rechtskader om tekst- en datamining mogelijk te maken, een uitzondering waarvoor reeds met succes in de Franse wetgeving is geïmplementeerd, zou het werk van het KBR Digital Research Lab ondersteunen.