Project

De eerste genoomwijde kaarten van het micropeptidoom gevalideerd door grootschalige heranalyse van publieke proteomics data

Code

3E010920

Looptijd

01-10-2020 → 13-02-2022

Financiering

Fonds voor Wetenschappelijk Onderzoek - Vlaanderen (FWO)

Promotor

Lennart Martens

Onderzoeksdisciplines

Natural sciences
- Computational transcriptomics and epigenomics
- Development of bioinformatics software, tools and databases
- Structural bioinformatics and computational proteomics
- Genetics
- Transcription and translation

Trefwoorden

niet-coderend RNA micropeptiden bio-informatica

Projectomschrijving

De complete annotatie van het genoom is essentieel om ontwikkeling tijdens gezondheid en ziekte te begrijpen. Desondanks is de annotatie van eiwit coderende genen ver van compleet. In het bijzonder micropeptiden, eiwitten kleiner dan 100 aminozuren, zijn historisch ondergerepresenteerd in genetische annotatiedatabanken. In mijn projectvoorstel zal ik een algoritme ontwikkelen gebaseerd op machine leren waarmee nieuwe micropeptiden kunnen gedetecteerd worden in lange niet-coderende RNA en circulair RNA annotatie. Dit algoritme zal ik toepassen op grote humane RNA sequencing gebaseerde transcriptomen en referentie annotatie van muis, Arabidopsis en gist om een in silico voorspeld micropeptidoom te bekomen. Vervolgens zal ik het bestaan van deze micropeptiden valideren aan de hand van grote hoeveelheden publieke tandem massaspectrometrie data. Voor deze analyses zal ik gebruik maken van Ionbot, een geavanceerde sequentiedatabank zoekmachine ontwikkeld in de onderzoeksgroep die open modificatie en open mutatie zoekopdrachten kan uitvoeren. In parallel zal ik in silico proteoom-wijde spectrum databanken bouwen en deze gebruiken om dezelfde data te analyseren. Tot slot zal ik alle bevindingen rapporteren in een eigen ontwikkelde publieke micropeptiden databank.