Project

Het onderzoeken van de toegevoegde waarde van machinaal leren en Twitter voor openbare gezondsheidsorganisaties tijdens COVID-19

Looptijd
01-09-2020 → Lopend
Financiering
Gewestelijke en gemeenschapsmiddelen: Bijzonder Onderzoeksfonds
Onderzoeksdisciplines
  • Social sciences
    • Market research
    • Marketing models
    • Data collection and data estimation methodology, computer programs
    • Mathematical and quantitative methods not elsewhere classified
Trefwoorden
sociale media machinaal leren Artificiële Intelligentie
 
Projectomschrijving

Het doel van dit onderzoeksproject is om een beslissingsondersteunend systeem te ontwikkelen voor openbare gezondheidsorganisaties. Dit systeem moet deze organisaties in staat stellen om verschillende problemen aan te pakken tijdens crisissen, zoals COVID19. De huidige COVID19 pandemie heeft ertoe geleid dat vele landen in lockdown zijn gegaan. Deze omstandigheden kunnen zorgen voor onrust bij de bevolking en daarvoor is het cruciaal dat de overheid op een gepaste manier reageert en communiceert. Twee aspecten zijn daarvan van cruciaal belang. Ten eerste, de overheid moet waken over het welzijn van zijn burgers tijdens deze crisis, aangezien dit een enorme impact heeft op de mentale gezondheid van de burgers. Ten tweede, de overheid moet ervoor zorgen dat de burgers correcte informatie krijgen en valse geruchten moeten gedetecteerd en opgelost worden. Met dit onderzoeksproject willen we aantonen hoe overheden deze twee aspecten kunnen aanpakken door het analyseren van openbare tweets in verband met COVID19. Hiervoor hebben we vanaf januari 2020 publieke Twitter data verzameld in verband met COVID19. Aangezien we vooral geïnteresseerd zijn in de inhoud van de tweet, werd enkel informatie gerelateerd aan de tweet verzameld. Met betrekking tot de gebruiker werd enkel het geanonymiseerde user ID verzameld. Tijdens voorgaande pandemieën werd Twitter vaak gebruikt voor het verspreiden van meningen en ervaringen. Daardoor kunnen tweets gebruikt worden voor real-time analyses, die overheden inzicht geven in de problemen in de samenleving waarop ze dan kunnen gepast kunnen reageren. Een eerste doel van dit project is om de impact van verschillende gebeurtenissen (bv. lockdown) voor verschillende industrieën (bv. supermarkten, kappers, ...) op het algemeen welzijn van de populatie. Om dit te bestuderen, gaan we uit de tekst van de tweet de relevante events en industrieën halen. We zullen de inhoud van de tweet gebruiken om de impact van deze verschillende events in verschillende industrieën op klantenwelzijn te verklaren. We zouden graag willen benadrukken dat welzijn op industrie-niveau zal worden geanalyseerd, dit betekent dus dat er geen analyse zal gedaan worden op individueel gebruikersniveau. Het tweede doel van dit project is om geruchten rond COVID19 te ontdekken. Een gerucht wordt in dit geval gedefinieerd als informatie dat nog niet door de overheid werd geverifieerd, maar wel al verspreid wordt op sociale media. Bijvoorbeeld, in het begin van de pandemie werden veel valse geruchten verspreid over de symptonen van het coronavirus. In dit project willen we focussen op het detecteren van tweets die geïdentificeerd zijn als geruchten. Om dit te doen gaan we een classificatie model bouwen dat zal voorspellen of een tweet een gerucht is of niet op basis van linguïstische, inhoudelijke, en netwerk variabelen. We gaan hiervoor state-of-the-art deep learning methodes gebruiken om succesvol te voorspellen of een tweet een gerucht is of niet. Hierbij willen we benadrukken dat er geen individuele identificeerbare gebruikersdata zal worden gebruikt om een gerucht te identificeren.