-
Natural sciences
- Single-cell data analysis
-
Medical and health sciences
- Analysis of next-generation sequence data
- Computational biomodelling and machine learning
- Computational transcriptomics and epigenomics
-
Engineering and technology
- Bio-informatics
Cellen modelleren is een fundamenteel probleem in bioinformatics. Sequencen van individuele cellen is onlangs opgekomen als een manier om biologie op een dieper niveau te onderzoeken, waardoor het maken van meer uitgebreide modellen mogelijk is. Deze technologie is inherent beperkt vanwege de lagere hoeveelheid genetisch materiaal die wordt gebruikt, waardoor de data incompleet is en de ruis erop toeneemt. De huidige methoden om dit te corrigeren slagen er niet in om (1) voorspellingen te contextualiseren door interacties tussen cellen en tussen biologische eigenschappen van elke cel te modelleren en (2) de netwerkstructuur van biologische systemen te incorporeren. In het voorgestelde onderzoeksproject proberen we deze problemen op te lossen door neurale netwerken te gebruiken die de netwerkstructuur van biologie kunnen nabootsen. Deze modellen schalen kwadratisch met de grootte van de inputs, wat hun gebruik onmogelijk maakt op de hoog-dimensionele sequencing data. De belangrijkste uitdaging is bijgevolg het ontwerpen van biologisch-geïnformeerde inductieve biases, waardoor de complexiteit daalt terwijl de performantie behouden blijft. Het voorgestelde framework is generiek van aard en wordt dus verwacht beter biologische fenomenen vast te leggen. Daarom zullen transfer learning mogelijkheden onderzocht worden. Bovendien zullen de modellen gemined worden voor biologische inzichten.