-
Natural sciences
- Machine learning and decision making
- Computational biomodelling and machine learning
- Structural bioinformatics and computational proteomics
Diep machinaal leren forceert momenteel doorbraken in een variëteit aan voorspellingstaken in proteoomstudies. Langeafstandsinteracties tussen verschillende regio’s in eiwitsequenties worden hier nog niet optimaal in benut. Recentelijk hebben context-bewuste vectorrepresentatiemodellen een revolutionaire verbetering bewerkstelligd in het veld van natuurlijke taalverwerking, en ook voor het leren van eiwitrepresentaties werden hiermee al veelbelovende resultaten behaald. Ons doel is om deze zelf-superviserende representatiemodellen te verrijken door deze ook op structuurpredictie te trainen. We zullen bestuderen hoe dit kan bijdragen bij twee structuur-afhankelijke predictietaken. De eerste is eiwit-secreteerbaarheid in gist, een essentieel kenmerk in fundamentele biologie en biotechnologie. De tweede is de predictie van locaties in eiwitten die door kinases gemodificeerd kunnen worden. Voor beiden zijn er geannoteerde datasets voorhanden in ons labo, via nieuwe experimentele en data-extractiemethoden. Bovendien zullen we attributiemethoden gebruiken om te kijken welke sequentiële en structurele eigenschappen in de ingevoerde data doorslaggevend bleken te zijn in de predictiemodellen. In samenwerking met onze onderzoekers zullen we ook de fragmenten in het humane proteoom die door de nieuwe predictiemodellen als secreteerbaar voorspeld worden, experimenteel verifiëren, en zullen we voorspelde secreteerbaarheid-verbeterende modificaties evalueren.