Project

Procesontginning met Recurrente Neurale Netwerken

Code

BOF/STA/201909/037

Looptijd

01-04-2020 → 31-01-2025

Financiering

Gewestelijke en gemeenschapsmiddelen: Bijzonder Onderzoeksfonds

Promotor

Seppe vanden Broucke

Onderzoeksdisciplines

Social sciences
- Business economics
- Business information management
- Management information systems
- Data collection and data estimation methodology, computer programs
- Mathematical methods, programming models, mathematical and simulation modelling
Engineering and technology
- Modelling and simulation

Trefwoorden

neurale netwerken recurrente neurale netwerken process discovery deep learning process mining

Projectomschrijving

Process Mining behelst een vrij jong onderzoekdomein dat zich situeert tussen business process management (BPM en data science. Het doel van het onderzoeksdomein is om de analyse van bedrijfsprocessen te ondersteunen op basis van "event logs" zoals ze worden bijgehouden door process-bewuste informatiesystemen, door middel van het toepassen van data mining technieken om zo een as-is procesmodel te extraheren of te ontginnen, problemen te identificeren of mogelijkheden tot verbetering aan te geven, of om de conformantie tussen een ontdekt process en beschreven process te onderzoeken.

Hoewel er in het domein reeds een groot aantal technieken werd voorgesteld voor processontgining heeft meer recent werk ook de toepassing van recurrente neurale netwerken (RNNs) onderzocht, welke een bepaalde vorm zijn van artificiele neurale netwerken die kunnen omgaan met sequenties. Deze technieken werden vooral toegepast in het domein van predictieve modeleren en monitoring van processen, bijvoorbeeld om voorspellingen te bieden in termen van meest waarschijnlijke volgende stap, tijd die een case nog in beslag zal nemen, enz. eerder dan de ontginning van een volledig beschrijvend proces model.

Onderzoek aangaande het gebruik van dergelijke krachtige modelen voor procesontginning is nog vrij beperkt, ondanks dat men kan verwachten dat een dergelijk model hiertoe in staat zou moeten zijn, aangezien een goed model abstractie zal maken van de semantiek van het onderliggende proces, gelijkaardig aan de toepassing van dergelijke modellen in het tekstuele domein, waar ze worden gebruik voor taalmodellering, tekst classificatie en tekst generatie. De hoofdreden hierachter ligt hoofdzakelijk aan het feit dat diepe neurale netwerken "black box" modellen zijn, met makkelijk miljoenen parameters die zich niet eenvoudig laten samenvatten of omzetten tot een hollistisch model. In dit werk zal worden onderzocht hoe de taak van procesontginning kan worden uitgevoerd met behulp van deze technieken, met drie hoofddoelen: ten eerste, het ontwikkelen van een procesontginningstechniek gebaseerd op RNNs die getraind werden om een "taalmodel" te leren bovenop de procesdata. Ten tweede: het includeren van data elementen samen met controleflow elementen om te onderzoeken of de techniek kan worden uitgebreid naar deze inputvorm, wat traditioneel een moeilijke setting is gebleken in het domein. Ten derde: de ontwikkeling van interpreteerbaarheidstechnieken die het mogelijk maken elementen uit het getrainde RNN model te linken aan elementen in het ontgonnen procesmodel, om interpretatie en nut naar menselijke eindgebruikers toe te verbeteren.