Project

Een nieuw tijdperk voor proteomics-gebaseerde proteïne PTM analyse met deep learning

Code
12B7123N
Looptijd
01-10-2022 → 30-09-2025
Financiering
Fonds voor Wetenschappelijk Onderzoek - Vlaanderen (FWO)
Mandaathouder
Onderzoeksdisciplines
  • Natural sciences
    • Proteomics
  • Medical and health sciences
    • Computational biomodelling and machine learning
    • Development of bioinformatics software, tools and databases
Trefwoorden
Diep leren Massaspectrometrie Posttranslationele modificaties Diep leren
 
Projectomschrijving

Post-translationele modificaties (PTM’s) zijn essentieel voor het correct functioneren van eiwitten. Ondanks dat onderzoek naar PTM’s mogelijk is via chromatografie gekoppeld aan tandem massa spectrometrie (LC-MS/MS), zijn de beschikbare bioinformatica methodes een limiterende factor. Inderdaad, door de grote verscheidenheid aan PTM’s, lijden proteomics search engines aan een verminderde identificatiegevoeligheid wanneer modificaties in rekening worden genomen. Deep learning modellen die het gedrag van peptiden in LC-MS/MS voorspellen, kunnen een verminderde identificatiegevoeligheid herstellen. Helaas bestaan zulke modellen niet voor gemodificeerde peptiden. Recent onderzoek door mezelf en mijn collega’s toont aan dat deep learning modellen in staat zijn om de voorspellingen te veralgemeniseren over gemodificeerde aminozuren heen. Daarom stel ik voor om deze modellen uit te breiden naar de voorspelling van peptide MS/MS spectra, en zo hun toepassing in open modification search engines toe te laten. Meer nog, door het integreren van LC en MS/MS voorspellingen en meer geavanceerde deep learning technieken, zal ik de accuraatheid van de voorspelling verbeteren tot de limiet van de technische variatie. Ik zal deze modellen ook gebruiken om de identificatie- en localisatie te verbeteren. Als laatste, zal ik deze methoden toepassen op een publieke proteomics data, om zo het meest gedetailleerde zicht ooit te genereren van het proteome-brede PTM landschap.