Een presentatie voor de tweede informatiedag voor het Professionaliseringstraject Informatiespecialisten Onderzoek (Van Bibliothecaris naar Embedded Librarian) van de Hogeschool Utrecht. De presentatie gaat in op wat datamanagement is, waarom dit belangrijk is, hoe datamanagement in z'n werk gaat en wie verantwoordelijk is voor bepaalde taken.
1. Datamanagement
HET WAT, WAAROM, HOE EN WIE
Presentatie voor de bijeenkomst ‘Van Bibliothecaris naar Embedded
Librarian’ – Hogeschool Utrecht, 17 oktober 2013 – Joeri Nortier
2. Even voorstellen
• SURF
- In 1988 opgezet
- Samenwerkingsorganisatie van
verschillende universiteiten,
hogescholen en instituten
- Gericht op ICT-innovaties om
kwaliteit onderwijs en onderzoek
te verbeteren
- Bestaat uit verschillende
organisaties
2
3. Onderdelen SURF
Garandeerd samenwerking en betrokkenheid van managers in het
hoger onderwijs en onderzoek
Verbindt ICT en gebruikers en zoekt naar nieuwe technieken
Biedt ICT, software en training
High-performance computing en visualisatie
Efficient managen van de resultaten van
samenwerkingsverbanden
3
4. Even voorstellen
• Mijn rol binnen SURF
- Projectcoördinator bij ICT en
Onderzoek
- Gericht op onderzoeksdata
- Special Interest Group
Research Data
- SIM4RDM
4
5. Opzet presentatie
• Wat is datamanagement (Research Data Management)?
• Waarom is datamanagement belangrijk?
• Hoe moet goed datamanagement worden uitgevoerd?
• Wie is verantwoordelijk voor welke delen van datamanagement?
• Wat kan SURF voor jullie doen?
5
7. Wat is Datamanagement?
• Definitie datamanagement: ‘alle werkzaamheden die te maken hebben met
het archiveren, collectioneren, beschrijven, toegankelijk maken en
publiceren van onderzoeksdata in digitale vorm’
• Definitie onderzoeksdata: ‘digitale gegevens die gebruikt (kunnen) worden
voor wetenschappelijk onderzoek, alsook de gegevens die uit
wetenschappelijk onderzoek worden gegenereerd’
• 3 belangrijke hoofdthema’s
1. Data-archivering
2. Metadata
3. Digitale duurzaamheid
7
8. Wat is
Datamanagement?
• Zowel tijdens als na het
onderzoeksproces
• Wordt steeds belangrijker
- Overheidsbeleid
- Steeds meer aandacht vanuit
onderzoekers en vanuit bestuurders
• Van groot naar klein
- Excell-sheet
- Big Data
8
11. Wat is
Datamanagement?
• Wat is belangrijke onderzoekdata?
- Hoge waarde
- Maatschappelijk
- Toekomstig
- Historisch
- Uniek
- Definitie wordt echter steeds
ruimer
11
13. Waarom is Datamanagement belangrijk?
Zeer veel redenen, hieronder een aantal belangrijke
• Groot voordeel voor onderzoekers zelf
• Onderdeel van een goed wetenschappelijk proces
‘Sound research rests on the ability to evidence, verify and reproduce results –
managing your data enables all three’ Simon Hodson, CODATA
• Goed voor de wetenschap in het algemeen
- Data blijft beschikbaar, ook nadat het onderzoek is afgelopen
- Internationale onderzoeksinfrastructuur
• Sneller en gemakkelijker data delen = sneller oplossingen voor problemen
- Meer mensen kunnen meewerken
- Onderzoek gaat sneller
13
14. Waarom is Datamanagement belangrijk?
• Goed voor de reputatie van een instelling
- Data die gemakkelijk te vinden is, zal veel worden gebruikt
- Veel citaties is een hoge ranking
• Controle van wetenschappelijke conclusies
- Gaat fraudegevallen tegen (integriteit)
• Wetgeving en regulering
- Eisen vanuit overheid, NWO, EU en uitgevers
• Sluit aan bij veranderen maatschappij
- Connected society
- Steeds meer data
14
16. Hoe moet goed datamanagement worden
uitgevoerd?
• Verschillende onderdelen waar rekening me gehouden moet worden
- datamanagementplannen
- opslag tijdens en na een onderzoeksproject
- cloudoplossingen voor opslag
- ondersteuning aan onderzoekers door dataprofessionals
- juridische aspecten
- security en privacy
• Verschillende niveau’s hebben verschillende wensen en zijn
verantwoordelijk voor verschillende onderdelen
- Bestuurders
- Data Librarians / Dataprofessionals / Ondersteuners
- Onderzoekers
16
17. Hoe moet goed datamanagement worden
uitgevoerd?
• Datamanagementplannen
- Opgesteld door financiers, uitgevers en bestuurders
- Schetst de kaders
- Vooraf in kaart brengen van benodigde voorzieningen en knelpunten
- Al verschillende pilotprojecten en ‘best practices’
- DANS, Regie in de Cloud,
• Opslag tijdens en na een onderzoeksproject
- Kan op verschillende niveaus worden aangeboden
- Groot verschil tussen opslag tijdens en na
- Digitale onderzoeksomgeving
- Opslag omgevingen (toch geen data kerkhoven?)
- Open Data?
- Heeft vele voordelen
- Onderzoek met publiek geld
17
18. Hoe moet goed datamanagement worden
uitgevoerd?
• Cloudoplossingen voor opslag
- Rekening houden met veiligheid
- Al enkele pilots uitgevoerd (Regie in de Cloud)
• Ondersteuning aan onderzoekers door dataprofessionals
- Geef waardering aan onderzoekers als zij hun onderzoeksdata delen
- Geef training op het gebied van datamanagement
- Richt een data-infrastructuur in
• Juridische aspecten
- WBP
- Aan verandering onderhevig en multi-interpretabel
• Security en Privacy
- Grote zorg voor onderzoekers
18
19. Hoe moet goed datamanagement worden
uitgevoerd?
• Wat willen onderzoekers?
- Controle en zekerheid over wat er met hun data gebeurt
- Privacy
- Iemand anders gaat er met mijn data vandoor!
- Beloning
- Citaties
- Vrijheid
- Elk wetenschapsveld is uniek, tools moeten hierop afgestemd zin
- Verplichten werkt contra-productief
- Cafetaria-model
- Ondersteuning
- Voordelen gelijk duidelijk
- Praktisch, gelijk toe te passen
19
20. Hoe moet goed
datamanagement worden
uitgevoerd?
• Wat willen data librarians?
- Een duidelijk mandaat van de
bestuurders
- Duidelijk beleid
- Goede opleidingen / cursussen
- Goede ICT voorzieningen
20
21. Hoe moet goed datamanagement worden
uitgevoerd?
7 stappen voor beter datamanagement aan een HO instelling (CODATA)
1. Onderzoeken hoe je instelling nu al met onderzoeksdata omgaat
2. Collega’s en bestuurders overtuigen van het nut van datamanagement
3. Bepaal welke positie je m.b.t. datamanagement wil innemen
- Betrek hierbij onderzoekers, IT, de bibliotheek, etc.
4. Zorg voor bewustwording bij onderzoekers
5. Zorg voor een robuuste en gemakkelijke infrastructuur
6. Zorg dat je data makkelijk te vinden en te citeren is
7. Blijf je beleid, training en infrastructuur verder ontwikkelen
21
23. Wie is verantwoordelijk voor welke delen
van Datamanagement?
• Taken Bestuurders
- Verantwoordelijke voor de kaders
- Opstellen datamanagementplan
- Datamanagement inbedden in cyclus van onderzoek
- Beschikbaar stellen van infrastructuur
- Incentives voor onderzoekers
- Vertalen van wensen onderzoekers en ondersteuners
- En natuurlijk: geld
- Voor goede ondersteuning, infrastructuur en beleid
- Ook kosten na afronding onderzoek!
- Datamanagement nu vaak nog een ondergeschoven kindje
23
24. Wie is verantwoordelijk voor welke delen
van Datamanagement?
• Taken Data Librarians
- Nieuw type ondersteuner is nodig: Dataprofessional
- Belangrijke taak in het ondersteunen van onderzoekers
- Schakelfunctie tussen de praktijk en het beleid
- Face-to-face contact belangrijk
- Training is nodig: ‘train the trainers’
- In VK en USA al veel online cursussen, vaak algemeen van karakter
- Ook in Nederland in opkomst (DANS, 3TU.Datacentrum)
• Wat heeft een dataprofessional nodig?
- De juiste mix van IT- en ‘soft skills’
- Dataspecifieke vaardigheden (technische vaardigheden)
- Algemene datavaardigheden (sociale vaardigheden)
24
25. Wie is verantwoordelijk voor welke delen
van Datamanagement?
• Taken Onderzoekers
- Zorgen voor kwaliteit en toegankelijkheid van data
- In voorbereiding onderzoek meenemen
- Beheer tijdens uitvoering
- Beheer na afronding onderzoek
- Kortom: datamanagement moet een bepaalde mindset worden
25
26. Wie is verantwoordelijk voor welke delen
van Datamanagement?
Uitwerking in de praktijk
• Front Office
- Bestaat uit ondersteuners
- Direct contact met gebruikers
- Instellingen
• Back Office
- Opslag en toegankelijkheid op lange termijn
- Expertisecentrum
- Landelijke datacentra
• Federatief model van SURF als voorbeeld
26
29. Wat kan SURF voor jullie betekenen?
• Communiceren en onderhandelen met de belangrijkste
spelers
• Commitment verzekeren op het bestuursniveau
• Partijen samenbrengen om tot een samenwerking te
komen
• Kennis en informatie uitwisselen
• Op de hoogte blijven van (inter)nationale trends
• In enkele gevallen het managen van kleine projecten of
pilots
• Voorbeeld: Regie in de Cloud
29
30. SOS Project - Uitdagingen
Weinig onderzoekers
Maatwerk en specialisatie
Projecten op de lange termijn
Veel ondersteuning per onderzoeker
O
N
D
E
R
S
T
E
U
N
I
N
G
Veel onderzoekers
Algemene hulp
Kleine projecten
Weinig ondersteuning per
onderzoeker
0
Aantal onderzoekers
20,000
30
31. SOS Project - Aanpak
O
N
D
E
R
S
T
E
U
N
I
N
G
Pool of project managers
Train-the-Trainer
Community building
Eén e-maildres
Outreach (website,
use cases, videos)
0
Aantal onderzoekers
20,000
31
32. Meer informatie?
• Website SURF – www.surf.nl/onderzoek
• Website DANS – www.dans.knaw.nl
• Website 3TU.Datacentrum – datacentrum.3tu.nl
• Website NWO – www.nwo.nl
• SIG Research Data - www.surfspace.nl/sig/28-research-data/
32