Acroniem
DDCM
Duurtijd
01-09-2020 → Lopend
Faculteit(en)
Groepsleider
Overige informatie
Onderzoeksdisciplines
-
Natural sciences
- Data mining
- Database systems and architectures
- Ontologies, data curation and text mining
-
Social sciences
- Information, knowledge and uncertainty
Omschrijving
Tegenwoordig groeien digitale informatiebronnen enorm. Een groot probleem is dat 'Big Data'-collecties niet altijd efficiënt behandeld kunnen worden door conventionele informatiebeheersystemen. Mogelijke redenen hiervoor zijn dat de datacollectie te groot is, dat de data te complex zijn of te veel imperfecties bevatten en dat deze data niet snel genoeg kunnen worden verwerkt.
Steeds meer organisaties leveren grote inspanningen voor het efficiënt verzamelen, organiseren en beheren van hun gegevens. Het onderzoek binnen DDCM (Database, Document and Content Management) is gericht op het ondersteunen van deze inspanningen. Om dit doel te bereiken worden er nieuwe technologieën onderzocht en ontwikkeld om efficiënt om te gaan met de vele data- endatabankuitdagingen die voortvloeien uit de uitdagingen binnen de wereld van Big Data en het natuurlijke, heterogene en imperfecte/onzekere karakter van informatie.
Een belangrijk deel van het onderzoek focust op de ontwikkeling van nieuwe technieken voor het meten, verbeteren en weergeven van de kwaliteit van data. Deelaspecten hiervan zijn
• koppeling en integratie van data uit heterogene bronnen,
• ontdubbelen van databronnen,
• gebruik van regels (edit regels, functionele afhankelijkheden, …) voor het waarborgen van consistentie,
• technieken voor herstel van data (imputatie, correctie, …),
• analyse van de kwaliteit van nieuwsbronnen,
• het behandelen van context (in bv. crowd-sourcing),
• efficiënt opslaan van temporele data,
• kwaliteit en gebruiksgemak van databanken en databankschema’s en
• veracity van Big data.
Daarnaast heeft de groep expertise in het beter toegankelijk maken van databanken, documenten en multimedia-archieven. Deelonderzoek handelt over
• efficiënte bevraging van Big Data,
• flexibele databankbevraging,
• data-anonimisering en pseudonimisering,
• koppeling en semantische analyse van tekstuele data en
• het meten en verbeteren van FAIRness (Findability, Accessibility, Interoperability and Reusability) van data(banken).
Tot slot is DDCM expert in computationele intelligentietechnieken voor databeheer, data-analyse en beslissingsondersteuning.
De onderzoeksgroep heeft ruime ervaring met projecten in de biomedische, farmaceutische en juridischedomeinen.