Project

Een interpreteerbaar en performant beslissingsondersteunend systeem voor longitudinale big data

Code
3S017117
Looptijd
01-01-2017 → 31-12-2020
Financiering
Fonds voor Wetenschappelijk Onderzoek - Vlaanderen (FWO)
Mandaathouder
Onderzoeksdisciplines
  • Natural sciences
    • Data mining
    • Knowledge representation and reasoning
    • Machine learning and decision making
    • Neural, evolutionary and fuzzy computation
    • Health informatics
Trefwoorden
Big data Decision Support Systems interpreteerbare voorspellende modellen
 
Projectomschrijving

Het doel van dit onderzoek is om een ​​performant en begrijpbaar beslissingsondersteunend systeem te creëren
voor longitudinale big data, waardoor deze toepasbaar is in kritieke domeinen, waarbij verkeerde beslissingen worden genomen
kan aanzienlijke gevolgen hebben, zoals elektronische gezondheidszorg en telecommunicatie.
Om een ​​dergelijk platform te creëren, zullen een architectuur en algoritmen worden ontworpen die (i)
de enorme hoeveelheid longitudinale data efficiënt verwerken, (ii) een ensemble van white-box bouwen
modellen met behulp van observatiegegevens en voorkennis en (iii) dit ensemble vertalen in een single
interpreteerbaar model om beslissingsondersteuning te bieden aan experts. Om zo'n platform te creëren,
uitdagingen met betrekking tot de volgende onderwerpen zullen worden aangepakt:
1) Opnemen van voorkennis in voorspellende modellen, met behulp van semantische webtechnologieën, om
de leersnelheid en het generalisatievermogen verbeteren, wat leidt tot een hogere voorspelling
prestatie
2) Verbetering van de begrijpelijkheid van white-box ensembles door de verschillende modellen te combineren in een
enkelvoudig, interpreteerbaar model met verbeterde voorspellende prestaties vergeleken met de modellen
individueel
3) Efficiënte extractie van interpreteerbare functies met een hoog onderscheidend vermogen van longitudinale
gegevens om traceerbaar te zijn in een big data-omgeving
4) Ontwerp van voorgesteld platform en nieuw gerealiseerde algoritmen die voldoen aan big data-raamwerken
om hoge prestaties en schaalbaarheid te garanderen