2. Inhoud
Wie is Roel Bakker?
Overzicht werk voor Creating 010
2
3. Wie is Roel Bakker ?
http://www.linkedin.com/in/roelbakker10
http://scholar.google.nl/citations?user=GKPr_tAAAAAJ&hl=nl
Hoofddocent bij Informatica (0.5 fte), CMI, HR
big data (Hadoop), data science (statistiek, R, Twitter data), Java,
databases, cryptografie
Onderzoeker bij afd. Maatschapplijke Gezondheidszorg,
Erasmus MC (0.2 fte)
modelleren van infectieziektenverspreiding, met name HIV/SOA
Eigen bedrijf: Skardahl BV (0.1 fte)
simulatiesoftware
Onderzoeker bij Creating 010 (0.2 fte)
Achtergrond:
UvA (promotie, biologie/(elektro)fysiologie), RU Nijmegen, Univ
Wageningen
ABN Amro: technisch IT-specialist, IT-architect
4. Werk voor Creating 010
SIA Raak project – professsionals supported
architectuur
SunnyApp (simulatieterrasbezetting)
Techniek van agent based modeling
ligt in het verlengde van werk Erasmus MC
meer gericht op software architectuur van simulatiemodellen
'magic tree' data structuur
ontwerp complexe agent based (netwerk) modellen vs eenvoudige
deterministische modellen
CyberDEW project (vanaf 1 feb 2013)
vergelijking IDS (intrusion detecten systems)
5. Achtergrond: modelleren van infectieziektenverspreiding
http://anintroductiontoinfectiousdiseasemodelling.com/
MGZ, Erasmus MC
infectieziektenmodellen
STDSIM (HIV/SOA)
Onchosim (rivierblindheid)
Schistosim (schistosomiasis)
Lymfasim (elephantiasis)
Lepra, TB
kankerscreeningsmodellen
diverse varianten van MISCAN:
borstkanker, baarmoederhalskanker, colonkanker, etc
5
6. Modelleren van
infectieziektenverspreiding
http://anintroductiontoinfectiousdiseasemodelling.com/STD
STDSIM
STDSIM is een complex model, het simuleert
hypothetische individuen in een bevolking
inclusief:
geboorte, sterfte, immigratie, emigratie
seksuele relaties (incl concurrency), prostitutiecontacten, one-
off contacten
verschillende SOA en HIV
interventies: condoomgebruik, minder partners, SOA
behandeling tgv symptomen, massabehandeling, vaccinatie,
circumcision (M), screening, behandeling met AIDS remmers
(incl UTT)
6
10. STDSIM - example sexual networks
WB profile 3: concurrency, no CS
10
11. STDSIM - example sexual networks
WB profile 2: concurrency, CS
11
12. STDSIM: te complex ???
STDSIM: complex model, complexe software
te veel een 'black box'
risico op fouten
verborgen 'geheimen'
(klein) deel van mijn werk voor Creating 010
zoeken naar een oplossing voor het algemene probleem
van complexe modellen / software
12
13. Soorten modellen
deterministisch compartimentenmodel; macroscopisch
simulatie van fracties vd bevolking dmv continue toestandsvariabelen
model beschreven door stelsel differentiaalvergelijkingen
eenvoudig te implementeren, documenteren en verifieren
SIR model (vgl reactiekinetiek van chemische reacties)
stochastisch, discrete; microscopisch
simulatie van aantallen individuen in een bepaalde toestand mbv
discrete variabelen en stochastiek (RNG, trekkingen uit verdelingen)
relatief eenvoudig te implementeren, documenteren en valideren
voordelen: discrete bevolkingsgrootte, betrouwbaarheidsintervallen
(bijv bij eliminatievraagstukken)
nadelen: complexer, minder snel (elke toestandsovergang is een
event)
vgl reactiekinetiek waar het gedrag van individuele moleculen wordt
gesimuleerd, bijv (stochastic simulations algorithms, Gillespie)
13
14. Soorten modellen
deterministisch compartimentenmodel; macroscopisch
S I R
stochastisch, discrete; microscopisch
14
16. Soorten modellen
individual / agent based model
simulatie van individuen
heterogeniteit ('niet alle moleculen van een soort zijn gelijk')
realistisch (maar veel parameters)
andere processen dan Poisson processen (Poisson proces: vaste kans
per tijdseenheid => duur tot event uit exp verdeling)
'alles is mogelijk'
nadelen: validatie/verificatie van model
netwerk model
als individueel model, niet alleen random contacten tussen individuen
(in groepen), maar contact via relaties (links)
voordelen: realistisch
nadelen: complex, dynamiek van netwerk (begin/einde van link, links
tussen wie?)
16
20. Agent Based Modeling
Agent Based Modeling (incl network modeling)
is nodig (zie Nature, Doyne Farmer)
wordt populairder (oa tgv rekenkracht van PCs)
is de enige voor de hand liggende manier om processen in
netwerken te bestuderen
20
21. Complexiteit van ABM - 1
Hoe om te gaan met software complexiteit?
goede applicatieve infrastructuur
software libraries voor agent based modeling (Skardahl)
onderdelen van de Apache Commons Math library getest mbv R
slimme event scheduler (2x sneller dan Java PQ)
'Abstract Finite State Machine'
'Magic Tree' (publicatie in voorbereiding)
gedeeltelijk genereren van applicatie
specificeer model als deterministisch compartimenten model
genereer het discrete stochastische model (uit de 'rates' vd
differentiaalvergelijkingen)
genereer een ABM zonder heterogeniteit maar met agents
(objecten) ipv alleen aantallen
vergelijk met stochastisch model en deterministisch model
voeg heterogeniteit toe
21
22. Open issues
netwerk aspecten zijn niet eenvoudig te verifieren
misschien wel te toetsen aan theorie als alle 'nodes' gelijk
zijn?
visualisatie
veel inzicht in dit soort complexe modellen is te krijgen door
het gedrag te visualiseren
22
23. Infectiedruk in netwerken
(waar ik wakker van lig...)
NB vervang 'infectie' door alles wat 'besmettelijk' is
(gedrag, nieuws, trend, malware)
Is het mogelijk om op een willekeurig moment i/d
tijd te voorspellen wat de kans op besmetting is
van M (midden) en R (rechts)?
Vooral het risico dat R loopt is interessant.....
L R
M
23
24. Infectiedruk in netwerken
(waar ik wakker van lig...)
bij constante contact rate en transmissiekans
Pm(t) = 1 – exp(-bt)
L R
M
24
25. Simulatie terrasbezetting
Hoe werkt de simulatie?
Mensen in verschillende toestanden:
op zoek (10 min), op terras (30 min), winkelen (2u)
Terrassen van verschillende grootten, bijv
10, 20, 40, 100 stoelen
Aantal terrassen
Aantal mensen
Mensen kiezen terras at random, gewogen naar grootte
25