Project

Nieuwe statistische technieken voor de analyses van complexe data in de sociale wetenschappen

Code
01P01415
Looptijd
01-10-2015 → 30-09-2018
Financiering
Gewestelijke en gemeenschapsmiddelen: Bijzonder Onderzoeksfonds
Mandaathouder
Onderzoeksdisciplines
  • Social sciences
    • Psychometrics
    • Statistics and data analysis
Trefwoorden
Structurele Vergelijkingsmodellen multilevel data categorische data
 
Projectomschrijving

Sociaal onderzoek vereist steeds meer onderzoekers om grote en complexe data die vaak cross-nationaal van aard te verzamelen. Met behulp van grote vragenlijsten, vaardigheden, attitudes en eigenschappen worden gemeten en opgeslagen in grote datasets. Een typisch voorbeeld van een complexe dataset is het PISA-onderzoek (Program for International Student Assessment), een driejaarlijks internationaal onderzoek dat zich richt op onderwijs systemen wereldwijd te evalueren door het testen van vaardigheden en kennis op 15-jarige leerlingen. Statistische technieken te analyseren deze complexe gegevens moeten adequaat om te gaan met de combinatie van 1) de clustering van leerlingen in verschillende landen, 2) de categorische antwoordmogelijkheden van de vragenlijsten, zoals “correct” / “incorrect”, en 3) ontbrekende waarden in de gegevens wanneer respondenten niet in te vullen alle vragen. Helaas, de huidige beschikbare technieken niet adequaat omgaan met complexe data en als gevolg daarvan, onderzoekers vaak suboptimale analyse technieken toe te passen. In dit project, ik doel hebben om nieuwe statistische technieken ontwikkelen om grote en complexe data te analyseren op een correcte en praktische manier. Daartoe zal ik 1) de ontwikkeling van een algemene statistische methode voor het analyseren van complexe data, 2) oplossingen voor geclusterde gegevens met ontbrekende waarden en fit maatregelen aan te geven of een model past bij de gegevens te ontwikkelen, en 3) het ontwikkelen van vrij beschikbare software voor onderzoekers . Bovendien zal dit onderzoek leiden tot duidelijke richtlijnen voor onderzoekers in de sociale wetenschappen het omgaan met grote en complexe data.