Project

Multi-label semi-supervised leren voor big data problemen

Code

01P13514

Looptijd

01-10-2014 → 01-06-2016

Financiering

Gewestelijke en gemeenschapsmiddelen: Bijzonder Onderzoeksfonds

Promotor

Bart Lambrecht

Mandaathouder

Isaac Triguero

Onderzoeksdisciplines

Natural sciences
- Animal biology
Agricultural and food sciences
- Veterinary medicine
- Other veterinary sciences
- Other agricultural and food sciences

Trefwoorden

multi-label data problemen

Projectomschrijving

In het tijdperk van big data wordt het analyseren en extraheren van kennis uit grootschalige datasets een zeer uitdagende taak. De toepassing van standaard dataminingtools in dergelijke datasets is niet eenvoudig. Daarom is een nieuwe klasse schaalbare mining-methoden vereist die de enorme opslag- en verwerkingscapaciteiten van cloudplatforms omvat.
In dit onderzoeksvoorstel zullen we zeer schaalbare methoden ontwerpen voor preprocessing en data mining-taken om big data-problemen in het algemeen aan te pakken, en in het bijzonder die welke kunnen worden ingelijst in de semi-begeleide multi-label leercontext. Dit recente onderwerp trekt veel aandacht in veel echte toepassingen, zoals bio-informatica, beeldclassificatie, tekst mining, web mining, spraakherkenning, etc.
We zullen het semi-begeleide multi-label leerprobleem aanpakken met behulp van preprocessing
technieken en nieuwe classificatiemethoden. Na een zorgvuldige studie van de state-of-the-art, zullen we nieuwe classificatie-algoritmen ontwikkelen. Vervolgens zullen we nieuwe functieselectie / wegingsalgoritmen en instantieverminderingstechnieken ontwikkelen om big data-problemen aan te pakken en het gebrek aan schaalbaarheid van bestaande voorstellen overtreffen met behulp van cloudgebaseerde technologieën.
Als toepassingsdomeinen zullen we ons richten op problemen met datamining in de context van bio-informatica.
De recente data-explosie in deze velden vereist het gebruik van schaalbare tools voor datamining.