Project

Multi-label semi-supervised leren voor big data problemen

Code
01P13514
Looptijd
01-10-2014 → 01-06-2016
Financiering
Gewestelijke en gemeenschapsmiddelen: Bijzonder Onderzoeksfonds
Mandaathouder
Onderzoeksdisciplines
  • Natural sciences
    • Animal biology
  • Agricultural and food sciences
    • Veterinary medicine
    • Other veterinary sciences
    • Other agricultural and food sciences
Trefwoorden
multi-label data problemen
 
Projectomschrijving

In het tijdperk van big data wordt het analyseren en extraheren van kennis uit grootschalige datasets een zeer uitdagende taak. De toepassing van standaard dataminingtools in dergelijke datasets is niet eenvoudig. Daarom is een nieuwe klasse schaalbare mining-methoden vereist die de enorme opslag- en verwerkingscapaciteiten van cloudplatforms omvat.
In dit onderzoeksvoorstel zullen we zeer schaalbare methoden ontwerpen voor preprocessing en data mining-taken om big data-problemen in het algemeen aan te pakken, en in het bijzonder die welke kunnen worden ingelijst in de semi-begeleide multi-label leercontext. Dit recente onderwerp trekt veel aandacht in veel echte toepassingen, zoals bio-informatica, beeldclassificatie, tekst mining, web mining, spraakherkenning, etc.
We zullen het semi-begeleide multi-label leerprobleem aanpakken met behulp van preprocessing
technieken en nieuwe classificatiemethoden. Na een zorgvuldige studie van de state-of-the-art, zullen we nieuwe classificatie-algoritmen ontwikkelen. Vervolgens zullen we nieuwe functieselectie / wegingsalgoritmen en instantieverminderingstechnieken ontwikkelen om big data-problemen aan te pakken en het gebrek aan schaalbaarheid van bestaande voorstellen overtreffen met behulp van cloudgebaseerde technologieën.
Als toepassingsdomeinen zullen we ons richten op problemen met datamining in de context van bio-informatica.
De recente data-explosie in deze velden vereist het gebruik van schaalbare tools voor datamining.