Project

Bruikbare technieken voor de exploratie, exploitatie en planning in dynamische aanbevelingssystemen

Code
01P02321
Looptijd
01-10-2021 → 25-09-2022
Financiering
Gewestelijke en gemeenschapsmiddelen: Bijzonder Onderzoeksfonds
Promotor
Mandaathouder
Onderzoeksdisciplines
  • Natural sciences
    • Adaptive agents and intelligent robotics
    • Data mining
    • Machine learning and decision making
    • Natural language processing
    • Neural, evolutionary and fuzzy computation
Trefwoorden
Aanbevelingssystemen Exploration vs uitbuiting Planning Active gevolgtrekking Model capaciteit
 
Projectomschrijving

Aanbevelingssystemen zijn tegenwoordig te vinden op veel populaire platformen zoals streamingdiensten, webshops, sociale media, enz. Deze technologie is matuur, maar er zijn nog enkele belangrijke tekortkomingen die moeten worden opgelost. Ten eerste moet het "long tail"-fenomeen worden aangepakt door meer aandacht te schenken aan de vele minder populaire items; dit zal leiden tot uitdagingen met kleinschalige en ijle data. Ten tweede moeten we het echokamereffect terugdringen: moderne systemen raden enkel gelijkaardige items aan zonder de gebruiker buiten zijn of haar comfortzone te duwen. De systemen moeten dus proactiever worden. Ten derde leiden nieuwe items en veranderingen in de context en smaak van een gebruiker tot verschuivingen in de datadistributies. Door de systemen robuust te maken voor dergelijke niet-stationaire data kan dit worden opgelost. In dit project wil ik sequentiële generatieve modellen en active inference gebruiken als tools om het hoofd te bieden aan deze problemen. Active inference zorgt voor een inherente afweging tussen exploratie en exploitatie, wat de long tail en de echokamers doet krimpen. Daarnast zorgt het generatieve model ervoor dat we transparant kunnen plannen om het aanbevelingsproces te sturen. We kijken ook naar hoe we de capaciteit van onze modellen kunnen optimaliseren, op statische of dynamische wijze. Ons werk zal geëvalueerd worden in echte online omgevingen, gezien offline evaluatie kan leiden tot ongewenste feedbacklussen.