SlideShare a Scribd company logo
1 of 38
Download to read offline
DR. STIJN HOPPENBROUWERS
DR. MAYA SAPPELLI
DR. VINCENT WIEGEL
SMART LEAN: BIG DATA AND
MACHINE LEARNING
WIE ZIET ER
KANSEN VOOR
BIG DATA IN
ZIJN
ORGANISATIE?
2
LINKEDIN: SOCIAL NETWORK DAT
PROEFSSIONALS HELPT
PRODUCTIEVER EN SUCCESVOLLER TE
WORDEN
TRACK ALLE CLICKS, PAGE VIEWS,
INTERACTIONS

AANBEVELING VOOR CONNECTIES,
PROFILE VIEWS, ADVERTISING
+40 MILJOEN NIEUWE LEDEN Q1 + Q2
2015
700 MILJOEN OMZET PER KWARTAAL
3
NEST: SLIMME THERMOSTAAT MET
INTERNET OF THINGS OPZET
REDUCTIE VAN ENERGIE-VERSPILLING
NEST LEERT GEBRUIKSPATROON, LEGT
IEDERE ACTIE VAST

STEMT VERWARMING DAAR OP AF
-50% ENERGIE-VERSPILLING
-10% VERWARMINGSKOSTEN
-15% AIRCO KOSTEN
4
ONLY 1/5 OF MEDICAL
DOCTORS WITH STATISTICAL
TRAINING CAN UNDERSTAND
SCIENTIFIC RESEARCH
PAPERS
...MOST MEDICAL DOCTORS
DON’T HAVE STATISTICAL
TRAINING
5
INCORRECTE –
UNDERPOWERED -
STATISTIEK
VEROORZAAKTE
+20% BOTSINGEN
+60% AANGEREDEN
VOETGANGERS
+100% AANGEREDEN
FIETSERS
6
Valide
conclusie?
7
DATA SCIENCE BIJSLUITER
• Veel potentieel
• Veel onwetendheid
• Veel onkunde
• Veel risico op onzin en slechte beslissingen
Er zijn veel
kansen! Maar
dat vereist wel
een goede
basis...
9
STIJN HOPPENBROUWERS
Stijn Hoppenbrouwers is lector Data & Knowledge Engineering bij de HAN en universitair
docent bij de afdeling Data Science aan de Radboud Universiteit. Vanuit een achtergrond
in informatiesystemen en taalwetenschappen, een PhD in Computer Science, richt Stijn
zich op praktijkgericht ontwerp en toepassing van data- en kennistechnologie, met open
oog voor het samenspel tussen techniek, mens en organisatie.
MAYA SAPPELLI
Maya Sappelli is onderzoeker Data Science bij het lectoraat Data & Knowledge
Engineering bij de HAN. Maya heeft een achtergrond in Kunstmatige Intelligentie en
Taalwetenschappen, en een PhD in Computer Science. Na toegepast onderzoek te
hebben gedaan bij TNO en FDMG richt ze zich bij de HAN op het helpen van bedrijven
en organisaties om meerwaarde te creëren met data door het inzetten van de juiste
technieken.
LEAN & BIG DATA / MACHINE LEARNING
Artificial intelligence: Autonomous,
machine-based reasoning system
Omgeving waarnemen
Redeneren over doelen
Acties in gang zetten
Data science: methoden, processen en
systemen om kennis en inzichten te
onttrekken uit (zowel gestructureerde als
ongestructureerde) data
‘ de wetenschap die zich bezig houdt metmethoden, processen en systemen om
kennis en inzichten te onttrekken uit (zowel gestructureerde als ongestructureerde)
data.’ (wikipedia)
DATA SCIENCE
VRAAG & ANTWOORD
• Typen Vragen:
- Descriptief (beschrijvend): Hoeveel auto’s heb ik verkocht?
- Predictief (voorspellend): Hoeveel auto’s zal ik volgende maand verkopen?
- Prescriptief (voorschrijvend): Wat moet ik doen om 10% meer auto’s te
verkopen?
• Typen Antwoorden:
- Geven kennis of informatie bijv. informatie over de huidige situatie
- Lossen een probleem op bijv. reduceren de hoeveelheid benodidgde
menselijke inzet
- Ondersteunen een beslissing: bijv. een constatering van een tumor met hoge
zekerheid
- Geven een financieel voordeel: bijv. meer gebruikers
AI & DATA SCIENCE
Artificial
Intelligence
Data
Data Science
Machine Learning
Data Science
Big Data
AI
Deep Learning
Machine Learning
Sensor Data
IoT
Social Media
Analytics
Statistics
SPSS
R
Python
Text Mining
Natural Language Processing
Logic
Decision Support
Semantic Web
OntologiesExpert Systems
Databases
Data Modelling
Data Warehousing
Data Management
Data Governance
SQL
Data semantics
Data Quality Data Engineering
NoSQL Business Intelligence (BI)
Applied
(e)Health
Energy
Smart Industry
Smart Mobility
Smart Cities
Legal Tech
Privacy
Security
Media
TensorflowHadoop
Docker
Ethics
Explainability
A CASE
• Achterstand in onderhoud: 200 machines
• Teveel draai-uren > extra problemen
• Gedoe in afstemming met klant
A CASE
A CASE
Modeling Task
Value Proposition
End-User Actions Data Sources
Deployment
and Integration
Monitoring and
Value Testing
Licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.Adapted from The Machine Learning Canvas by Louis Dorard, Ph.D.
Machine Learning Canvas Designed for: Designed by: Date: Iteration: .
End-User Persona
Model Evaluation
Business Objectives
What methods and
metrics can be used to
monitor ’online’ model
performance? How is
the actual business
value measured?
How can the model be
deployed and brought
into production? How
is it exposed to the
end-user and
integrated in a product
or service?
How do predictions elicit actions (or
decisions) that result in the proposed value
for the end-user?
What are we going to predict and with what
information? What is the type of machine
learning problem?
Which raw data sources can we use (internal
and external)? How and with what frequency
should the data be collected?
What methods and metrics can be used to
evaluate the ‘offline’ performance? What is
the cost of being wrong?
Who are the end-users of the predictive model? What are the
jobs they need to get done? What are their immediate pains and
potential gains in trying to do so?
How do we help the end-users get the job done and satisfy
their needs? How do we alleviate or eliminate their pains and
create value through gains?
What business objectives are we serving? What KPI will be
improved and by how much? What is the business value and
how can it be measured?
YOUR CASE
• Wat zijn zoal interessante databronnen die je kent?
• Intern / Extern
• Wat zijn issues op het werk die je nu hebt?
• Welke informatievraag zit daar achter? (dialoog)
• Hoe kun je naar antwoord toewerken op basis van info/data bronnen?
• Heb je die bronnen al, of moet je er aan zien te komen?
UITDAGINGENKANSEN
TAKE AWAYS: COMPUTER SAYS …
• Voorspellen kwaliteit
• Planning verbeteren
• Versterking medewerkers
• Patronen ontdekken
• Nieuwe toepassingen ontdekken
• Complex
• Formaliseren
• Veel goede data nodig
• Beperkte statistische kennis
PAUZE
Ongestructureerde dataGestructureerde Data
GESTRUCTUREEDE VERSUS ONGESTRUCTUREERDE DATA
• Georganiseerd
• (goed) geformatteerd
• Makkelijk doorzoekbaar
• Ongeorganiseerd
• Vrij format
• Tekst / Beeld / Audio
A CASE – SOCIAL MEDIA
• Routing voor webcare
• Snelle inzichten in reputatie
• Hoe visualiseer je ‘begrip’?
A CASE
INGREDIENTS
• Kennis van ‘waar' (metadata / entiteit herkenning)
• Kennis van ‘wie' (metadata / entiteit herkenning)
• Kennis van ‘hoe' (sentiment analysis)
• Kennis van ‘wat' (topic detectie)
ENTITEITEN
SENTIMENT ANALYSE
Wat is het sentiment?
1. Op basis van woordenlijsten - 'negatieve woorden' en 'positieve woorden'
a. Is 'ziek', negatief of positief
b. Hoe zit het met 'geen idee' of 'niet zo goed'
2. Op basis van machine learning
Uitdagingen:
- sarcasme, ironie, etc.
- meerdere sentimenten in 1 zin
TOPICS
• Woorden tellen
• TFIDF
• Ngrams
WORD CLOUDS
TOPICS
ONGESTRUCTUREERDE DATA: ANDERE TOEPASSINGEN
• Klachtenanalyse
• Analyse van foutmeldingen
• Zoeken van informatie in tekstuele documenten
• Juridisch Kennismanagement
• Beeldherkenning
YOUR CASE
• Wat voor ongestructureerde data heb je in huis?
• Wat voor externe data kan relevant zijn?
• Is er een vraag die je met deze data zou kunnen beantwoorden?
• Moet er daarvoor nog een interpretatieslag gemaakt worden?
TAKE AWAYS
• Er is gestructureerde en ongestructureerde data
- Andere eigenschappen
- Andere visualisaties
• Ongestructureerde data moet nog ’geinterpreteerd’ worden:
- Wie
- Wat
- Waar
- Hoe
CONCRETE PROJECTEN EN OPLEIDINGEN
< Master Engineering Systems – Lean
< Lean 4zero
Master Applied Data Sciences >
Lean & Robotica >
< Digital factory
Factory of the future >
CONCLUSIES
DANK VOOR JULLIE
DEELNAME
TIJD VOOR EEN DRANKJE..

More Related Content

Similar to Smart lean: Big Data and Machine Learning

Eduvision - Webinar Hoe Word Ik Big Data Professional?
Eduvision - Webinar Hoe Word Ik Big Data Professional?Eduvision - Webinar Hoe Word Ik Big Data Professional?
Eduvision - Webinar Hoe Word Ik Big Data Professional?Eduvision Opleidingen
 
Big Data in Retail: too big to ignore
Big Data in Retail: too big to ignoreBig Data in Retail: too big to ignore
Big Data in Retail: too big to ignorevalantic NL
 
Kan ik ooit op mijn data vertrouwen 2019?
Kan ik ooit op mijn data vertrouwen 2019? Kan ik ooit op mijn data vertrouwen 2019?
Kan ik ooit op mijn data vertrouwen 2019? TNO
 
Presentatie symposium Data driven HR with a human touch
Presentatie symposium Data driven HR with a human touchPresentatie symposium Data driven HR with a human touch
Presentatie symposium Data driven HR with a human touchFloris de Klerk
 
Big Data - een kijk in jouw toekomst
Big Data - een kijk in jouw toekomstBig Data - een kijk in jouw toekomst
Big Data - een kijk in jouw toekomstOscar Wijsman
 
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'ScienceWorks
 
Training Analytics 2017 - basics and importance of metrics
Training Analytics 2017 - basics and importance of metricsTraining Analytics 2017 - basics and importance of metrics
Training Analytics 2017 - basics and importance of metrics➚ Mike van Hoenselaar
 
Big Data Expo 2015 - Centennium De lucht eruit
Big Data Expo 2015 - Centennium De lucht eruitBig Data Expo 2015 - Centennium De lucht eruit
Big Data Expo 2015 - Centennium De lucht eruitBigDataExpo
 
Big Data - de lucht eruit! - Door Antoine Stelma
Big Data - de lucht eruit! - Door Antoine StelmaBig Data - de lucht eruit! - Door Antoine Stelma
Big Data - de lucht eruit! - Door Antoine StelmaCentennium
 
Marketing and Digital Analytics door Mike van Hoenselaar bi The talent institute
Marketing and Digital Analytics door Mike van Hoenselaar bi The talent instituteMarketing and Digital Analytics door Mike van Hoenselaar bi The talent institute
Marketing and Digital Analytics door Mike van Hoenselaar bi The talent instituteOnline Boswachters
 
NL Module 4 - Business Model
NL Module 4 - Business ModelNL Module 4 - Business Model
NL Module 4 - Business Modelcaniceconsulting
 
Analytics Fundamentals The Talent Institute
Analytics Fundamentals The Talent InstituteAnalytics Fundamentals The Talent Institute
Analytics Fundamentals The Talent InstituteOnline Boswachters
 
Foundation of Analytics (Mike van Hoenselaar) april 2017
Foundation of Analytics (Mike van Hoenselaar) april 2017Foundation of Analytics (Mike van Hoenselaar) april 2017
Foundation of Analytics (Mike van Hoenselaar) april 2017Online Boswachters
 
Marketing_Trend_Event_2023_-_AI__De_impact_van_technologie_-_Data_gestuurde_t...
Marketing_Trend_Event_2023_-_AI__De_impact_van_technologie_-_Data_gestuurde_t...Marketing_Trend_Event_2023_-_AI__De_impact_van_technologie_-_Data_gestuurde_t...
Marketing_Trend_Event_2023_-_AI__De_impact_van_technologie_-_Data_gestuurde_t...OrangeValley
 
Masterclass Analytics voor USG People door Mike van Hoenselaar
Masterclass Analytics voor USG People door Mike van HoenselaarMasterclass Analytics voor USG People door Mike van Hoenselaar
Masterclass Analytics voor USG People door Mike van Hoenselaar➚ Mike van Hoenselaar
 
NL - Module 2 - Using your own Data
NL - Module 2 - Using your own DataNL - Module 2 - Using your own Data
NL - Module 2 - Using your own Datacaniceconsulting
 
Workshop social media en arbeidsmarktcommunicatie
Workshop social media en arbeidsmarktcommunicatieWorkshop social media en arbeidsmarktcommunicatie
Workshop social media en arbeidsmarktcommunicatieErnst Schipper
 
The Talent Institute - Analytics (mike van hoenselaar) januari 2017
The Talent Institute - Analytics (mike van hoenselaar) januari 2017The Talent Institute - Analytics (mike van hoenselaar) januari 2017
The Talent Institute - Analytics (mike van hoenselaar) januari 2017➚ Mike van Hoenselaar
 
Kick off SPRINT@Work 16 jan 2014
Kick off SPRINT@Work 16 jan 2014Kick off SPRINT@Work 16 jan 2014
Kick off SPRINT@Work 16 jan 2014Lisette Giepmans
 
Voorbij het personenalarmsysteem. De ontwikkeling van nieuwe ICT-toepassingen...
Voorbij het personenalarmsysteem. De ontwikkeling van nieuwe ICT-toepassingen...Voorbij het personenalarmsysteem. De ontwikkeling van nieuwe ICT-toepassingen...
Voorbij het personenalarmsysteem. De ontwikkeling van nieuwe ICT-toepassingen...Pieter Duysburgh
 

Similar to Smart lean: Big Data and Machine Learning (20)

Eduvision - Webinar Hoe Word Ik Big Data Professional?
Eduvision - Webinar Hoe Word Ik Big Data Professional?Eduvision - Webinar Hoe Word Ik Big Data Professional?
Eduvision - Webinar Hoe Word Ik Big Data Professional?
 
Big Data in Retail: too big to ignore
Big Data in Retail: too big to ignoreBig Data in Retail: too big to ignore
Big Data in Retail: too big to ignore
 
Kan ik ooit op mijn data vertrouwen 2019?
Kan ik ooit op mijn data vertrouwen 2019? Kan ik ooit op mijn data vertrouwen 2019?
Kan ik ooit op mijn data vertrouwen 2019?
 
Presentatie symposium Data driven HR with a human touch
Presentatie symposium Data driven HR with a human touchPresentatie symposium Data driven HR with a human touch
Presentatie symposium Data driven HR with a human touch
 
Big Data - een kijk in jouw toekomst
Big Data - een kijk in jouw toekomstBig Data - een kijk in jouw toekomst
Big Data - een kijk in jouw toekomst
 
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
 
Training Analytics 2017 - basics and importance of metrics
Training Analytics 2017 - basics and importance of metricsTraining Analytics 2017 - basics and importance of metrics
Training Analytics 2017 - basics and importance of metrics
 
Big Data Expo 2015 - Centennium De lucht eruit
Big Data Expo 2015 - Centennium De lucht eruitBig Data Expo 2015 - Centennium De lucht eruit
Big Data Expo 2015 - Centennium De lucht eruit
 
Big Data - de lucht eruit! - Door Antoine Stelma
Big Data - de lucht eruit! - Door Antoine StelmaBig Data - de lucht eruit! - Door Antoine Stelma
Big Data - de lucht eruit! - Door Antoine Stelma
 
Marketing and Digital Analytics door Mike van Hoenselaar bi The talent institute
Marketing and Digital Analytics door Mike van Hoenselaar bi The talent instituteMarketing and Digital Analytics door Mike van Hoenselaar bi The talent institute
Marketing and Digital Analytics door Mike van Hoenselaar bi The talent institute
 
NL Module 4 - Business Model
NL Module 4 - Business ModelNL Module 4 - Business Model
NL Module 4 - Business Model
 
Analytics Fundamentals The Talent Institute
Analytics Fundamentals The Talent InstituteAnalytics Fundamentals The Talent Institute
Analytics Fundamentals The Talent Institute
 
Foundation of Analytics (Mike van Hoenselaar) april 2017
Foundation of Analytics (Mike van Hoenselaar) april 2017Foundation of Analytics (Mike van Hoenselaar) april 2017
Foundation of Analytics (Mike van Hoenselaar) april 2017
 
Marketing_Trend_Event_2023_-_AI__De_impact_van_technologie_-_Data_gestuurde_t...
Marketing_Trend_Event_2023_-_AI__De_impact_van_technologie_-_Data_gestuurde_t...Marketing_Trend_Event_2023_-_AI__De_impact_van_technologie_-_Data_gestuurde_t...
Marketing_Trend_Event_2023_-_AI__De_impact_van_technologie_-_Data_gestuurde_t...
 
Masterclass Analytics voor USG People door Mike van Hoenselaar
Masterclass Analytics voor USG People door Mike van HoenselaarMasterclass Analytics voor USG People door Mike van Hoenselaar
Masterclass Analytics voor USG People door Mike van Hoenselaar
 
NL - Module 2 - Using your own Data
NL - Module 2 - Using your own DataNL - Module 2 - Using your own Data
NL - Module 2 - Using your own Data
 
Workshop social media en arbeidsmarktcommunicatie
Workshop social media en arbeidsmarktcommunicatieWorkshop social media en arbeidsmarktcommunicatie
Workshop social media en arbeidsmarktcommunicatie
 
The Talent Institute - Analytics (mike van hoenselaar) januari 2017
The Talent Institute - Analytics (mike van hoenselaar) januari 2017The Talent Institute - Analytics (mike van hoenselaar) januari 2017
The Talent Institute - Analytics (mike van hoenselaar) januari 2017
 
Kick off SPRINT@Work 16 jan 2014
Kick off SPRINT@Work 16 jan 2014Kick off SPRINT@Work 16 jan 2014
Kick off SPRINT@Work 16 jan 2014
 
Voorbij het personenalarmsysteem. De ontwikkeling van nieuwe ICT-toepassingen...
Voorbij het personenalarmsysteem. De ontwikkeling van nieuwe ICT-toepassingen...Voorbij het personenalarmsysteem. De ontwikkeling van nieuwe ICT-toepassingen...
Voorbij het personenalarmsysteem. De ontwikkeling van nieuwe ICT-toepassingen...
 

More from HAN Lean-QRM Centrum / HAN Lectoraat Lean

Masterclass HANSEI - The Importance of Self-Reflection in Continuous Improvement
Masterclass HANSEI - The Importance of Self-Reflection in Continuous ImprovementMasterclass HANSEI - The Importance of Self-Reflection in Continuous Improvement
Masterclass HANSEI - The Importance of Self-Reflection in Continuous ImprovementHAN Lean-QRM Centrum / HAN Lectoraat Lean
 

More from HAN Lean-QRM Centrum / HAN Lectoraat Lean (20)

Masterclass HANSEI - The Importance of Self-Reflection in Continuous Improvement
Masterclass HANSEI - The Importance of Self-Reflection in Continuous ImprovementMasterclass HANSEI - The Importance of Self-Reflection in Continuous Improvement
Masterclass HANSEI - The Importance of Self-Reflection in Continuous Improvement
 
Webinar de weg towards the digital factory
Webinar de weg towards the digital factoryWebinar de weg towards the digital factory
Webinar de weg towards the digital factory
 
Webinar Aan de slag met Lean interventies
Webinar Aan de slag met Lean interventiesWebinar Aan de slag met Lean interventies
Webinar Aan de slag met Lean interventies
 
Webinar effectieve dag en weekstarts - mentimeter
Webinar effectieve dag en weekstarts  -  mentimeterWebinar effectieve dag en weekstarts  -  mentimeter
Webinar effectieve dag en weekstarts - mentimeter
 
Webinar effectieve dag en weekstarts
Webinar effectieve dag en weekstarts Webinar effectieve dag en weekstarts
Webinar effectieve dag en weekstarts
 
Webinar Succesvol robotiseren (door Vincent Wiegel en Aart Schoonderbeek)
Webinar Succesvol robotiseren  (door Vincent Wiegel en Aart Schoonderbeek)Webinar Succesvol robotiseren  (door Vincent Wiegel en Aart Schoonderbeek)
Webinar Succesvol robotiseren (door Vincent Wiegel en Aart Schoonderbeek)
 
Digital shadowing -case study
Digital shadowing -case studyDigital shadowing -case study
Digital shadowing -case study
 
Data barrières doorbreken voor rendement met Smart Industry
Data barrières doorbreken voor rendement met Smart IndustryData barrières doorbreken voor rendement met Smart Industry
Data barrières doorbreken voor rendement met Smart Industry
 
Masterclass De evolutie van Lean naar C-Lean (Jacqueline Hofstede)
Masterclass De evolutie van Lean naar C-Lean (Jacqueline Hofstede)Masterclass De evolutie van Lean naar C-Lean (Jacqueline Hofstede)
Masterclass De evolutie van Lean naar C-Lean (Jacqueline Hofstede)
 
Masterclass De evolutie van Lean naar C-Lean (door Jannes Slomp)
Masterclass De evolutie van Lean naar C-Lean (door Jannes Slomp)Masterclass De evolutie van Lean naar C-Lean (door Jannes Slomp)
Masterclass De evolutie van Lean naar C-Lean (door Jannes Slomp)
 
Webinar Towards the Digital Factory 2 - Gerlinde Oversluizen
Webinar Towards the Digital Factory 2 - Gerlinde OversluizenWebinar Towards the Digital Factory 2 - Gerlinde Oversluizen
Webinar Towards the Digital Factory 2 - Gerlinde Oversluizen
 
Webinar Towards the Digital Factory - Gerlinde Oversluizen
Webinar Towards the Digital Factory - Gerlinde Oversluizen Webinar Towards the Digital Factory - Gerlinde Oversluizen
Webinar Towards the Digital Factory - Gerlinde Oversluizen
 
Masterclass Learning to Lead - Mentimeter Poll Results
Masterclass Learning to Lead - Mentimeter Poll Results Masterclass Learning to Lead - Mentimeter Poll Results
Masterclass Learning to Lead - Mentimeter Poll Results
 
Masterclass Learning to Lead by Katie Anderson - September 2020
Masterclass Learning to Lead by Katie Anderson - September 2020Masterclass Learning to Lead by Katie Anderson - September 2020
Masterclass Learning to Lead by Katie Anderson - September 2020
 
6. Lean management implementeren- Conclusie door Wilfred Knol
6. Lean management implementeren- Conclusie door Wilfred Knol6. Lean management implementeren- Conclusie door Wilfred Knol
6. Lean management implementeren- Conclusie door Wilfred Knol
 
5. een praktijkvoorbeeld van lean implementeren door wilfred knol
5. een praktijkvoorbeeld van lean implementeren door wilfred knol5. een praktijkvoorbeeld van lean implementeren door wilfred knol
5. een praktijkvoorbeeld van lean implementeren door wilfred knol
 
4. |Een verklarend model voor Lean en continu verbeteren door Wilfred Knol
4. |Een verklarend model voor Lean en continu verbeteren door Wilfred Knol4. |Een verklarend model voor Lean en continu verbeteren door Wilfred Knol
4. |Een verklarend model voor Lean en continu verbeteren door Wilfred Knol
 
3. |Continu verbeteren en Lean door wilfred knol
3. |Continu verbeteren en Lean door wilfred knol3. |Continu verbeteren en Lean door wilfred knol
3. |Continu verbeteren en Lean door wilfred knol
 
2. kritieke succesfactoren voor lean management door wilfred knol
2. kritieke succesfactoren voor lean management door wilfred knol2. kritieke succesfactoren voor lean management door wilfred knol
2. kritieke succesfactoren voor lean management door wilfred knol
 
1. Introductie - Lean management implementeren door wilfred knol
1. Introductie - Lean management implementeren door wilfred knol1. Introductie - Lean management implementeren door wilfred knol
1. Introductie - Lean management implementeren door wilfred knol
 

Smart lean: Big Data and Machine Learning

  • 1. DR. STIJN HOPPENBROUWERS DR. MAYA SAPPELLI DR. VINCENT WIEGEL SMART LEAN: BIG DATA AND MACHINE LEARNING
  • 2. WIE ZIET ER KANSEN VOOR BIG DATA IN ZIJN ORGANISATIE? 2
  • 3. LINKEDIN: SOCIAL NETWORK DAT PROEFSSIONALS HELPT PRODUCTIEVER EN SUCCESVOLLER TE WORDEN TRACK ALLE CLICKS, PAGE VIEWS, INTERACTIONS  AANBEVELING VOOR CONNECTIES, PROFILE VIEWS, ADVERTISING +40 MILJOEN NIEUWE LEDEN Q1 + Q2 2015 700 MILJOEN OMZET PER KWARTAAL 3
  • 4. NEST: SLIMME THERMOSTAAT MET INTERNET OF THINGS OPZET REDUCTIE VAN ENERGIE-VERSPILLING NEST LEERT GEBRUIKSPATROON, LEGT IEDERE ACTIE VAST  STEMT VERWARMING DAAR OP AF -50% ENERGIE-VERSPILLING -10% VERWARMINGSKOSTEN -15% AIRCO KOSTEN 4
  • 5. ONLY 1/5 OF MEDICAL DOCTORS WITH STATISTICAL TRAINING CAN UNDERSTAND SCIENTIFIC RESEARCH PAPERS ...MOST MEDICAL DOCTORS DON’T HAVE STATISTICAL TRAINING 5
  • 6. INCORRECTE – UNDERPOWERED - STATISTIEK VEROORZAAKTE +20% BOTSINGEN +60% AANGEREDEN VOETGANGERS +100% AANGEREDEN FIETSERS 6
  • 8. DATA SCIENCE BIJSLUITER • Veel potentieel • Veel onwetendheid • Veel onkunde • Veel risico op onzin en slechte beslissingen
  • 9. Er zijn veel kansen! Maar dat vereist wel een goede basis... 9
  • 10. STIJN HOPPENBROUWERS Stijn Hoppenbrouwers is lector Data & Knowledge Engineering bij de HAN en universitair docent bij de afdeling Data Science aan de Radboud Universiteit. Vanuit een achtergrond in informatiesystemen en taalwetenschappen, een PhD in Computer Science, richt Stijn zich op praktijkgericht ontwerp en toepassing van data- en kennistechnologie, met open oog voor het samenspel tussen techniek, mens en organisatie. MAYA SAPPELLI Maya Sappelli is onderzoeker Data Science bij het lectoraat Data & Knowledge Engineering bij de HAN. Maya heeft een achtergrond in Kunstmatige Intelligentie en Taalwetenschappen, en een PhD in Computer Science. Na toegepast onderzoek te hebben gedaan bij TNO en FDMG richt ze zich bij de HAN op het helpen van bedrijven en organisaties om meerwaarde te creëren met data door het inzetten van de juiste technieken.
  • 11. LEAN & BIG DATA / MACHINE LEARNING Artificial intelligence: Autonomous, machine-based reasoning system Omgeving waarnemen Redeneren over doelen Acties in gang zetten Data science: methoden, processen en systemen om kennis en inzichten te onttrekken uit (zowel gestructureerde als ongestructureerde) data
  • 12. ‘ de wetenschap die zich bezig houdt metmethoden, processen en systemen om kennis en inzichten te onttrekken uit (zowel gestructureerde als ongestructureerde) data.’ (wikipedia) DATA SCIENCE
  • 13. VRAAG & ANTWOORD • Typen Vragen: - Descriptief (beschrijvend): Hoeveel auto’s heb ik verkocht? - Predictief (voorspellend): Hoeveel auto’s zal ik volgende maand verkopen? - Prescriptief (voorschrijvend): Wat moet ik doen om 10% meer auto’s te verkopen? • Typen Antwoorden: - Geven kennis of informatie bijv. informatie over de huidige situatie - Lossen een probleem op bijv. reduceren de hoeveelheid benodidgde menselijke inzet - Ondersteunen een beslissing: bijv. een constatering van een tumor met hoge zekerheid - Geven een financieel voordeel: bijv. meer gebruikers
  • 14. AI & DATA SCIENCE Artificial Intelligence Data Data Science Machine Learning
  • 15.
  • 16. Data Science Big Data AI Deep Learning Machine Learning Sensor Data IoT Social Media Analytics Statistics SPSS R Python Text Mining Natural Language Processing Logic Decision Support Semantic Web OntologiesExpert Systems Databases Data Modelling Data Warehousing Data Management Data Governance SQL Data semantics Data Quality Data Engineering NoSQL Business Intelligence (BI) Applied (e)Health Energy Smart Industry Smart Mobility Smart Cities Legal Tech Privacy Security Media TensorflowHadoop Docker Ethics Explainability
  • 17. A CASE • Achterstand in onderhoud: 200 machines • Teveel draai-uren > extra problemen • Gedoe in afstemming met klant
  • 20. Modeling Task Value Proposition End-User Actions Data Sources Deployment and Integration Monitoring and Value Testing Licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.Adapted from The Machine Learning Canvas by Louis Dorard, Ph.D. Machine Learning Canvas Designed for: Designed by: Date: Iteration: . End-User Persona Model Evaluation Business Objectives What methods and metrics can be used to monitor ’online’ model performance? How is the actual business value measured? How can the model be deployed and brought into production? How is it exposed to the end-user and integrated in a product or service? How do predictions elicit actions (or decisions) that result in the proposed value for the end-user? What are we going to predict and with what information? What is the type of machine learning problem? Which raw data sources can we use (internal and external)? How and with what frequency should the data be collected? What methods and metrics can be used to evaluate the ‘offline’ performance? What is the cost of being wrong? Who are the end-users of the predictive model? What are the jobs they need to get done? What are their immediate pains and potential gains in trying to do so? How do we help the end-users get the job done and satisfy their needs? How do we alleviate or eliminate their pains and create value through gains? What business objectives are we serving? What KPI will be improved and by how much? What is the business value and how can it be measured?
  • 21. YOUR CASE • Wat zijn zoal interessante databronnen die je kent? • Intern / Extern • Wat zijn issues op het werk die je nu hebt? • Welke informatievraag zit daar achter? (dialoog) • Hoe kun je naar antwoord toewerken op basis van info/data bronnen? • Heb je die bronnen al, of moet je er aan zien te komen?
  • 22. UITDAGINGENKANSEN TAKE AWAYS: COMPUTER SAYS … • Voorspellen kwaliteit • Planning verbeteren • Versterking medewerkers • Patronen ontdekken • Nieuwe toepassingen ontdekken • Complex • Formaliseren • Veel goede data nodig • Beperkte statistische kennis
  • 23. PAUZE
  • 24. Ongestructureerde dataGestructureerde Data GESTRUCTUREEDE VERSUS ONGESTRUCTUREERDE DATA • Georganiseerd • (goed) geformatteerd • Makkelijk doorzoekbaar • Ongeorganiseerd • Vrij format • Tekst / Beeld / Audio
  • 25. A CASE – SOCIAL MEDIA • Routing voor webcare • Snelle inzichten in reputatie • Hoe visualiseer je ‘begrip’?
  • 27. INGREDIENTS • Kennis van ‘waar' (metadata / entiteit herkenning) • Kennis van ‘wie' (metadata / entiteit herkenning) • Kennis van ‘hoe' (sentiment analysis) • Kennis van ‘wat' (topic detectie)
  • 29. SENTIMENT ANALYSE Wat is het sentiment? 1. Op basis van woordenlijsten - 'negatieve woorden' en 'positieve woorden' a. Is 'ziek', negatief of positief b. Hoe zit het met 'geen idee' of 'niet zo goed' 2. Op basis van machine learning Uitdagingen: - sarcasme, ironie, etc. - meerdere sentimenten in 1 zin
  • 30. TOPICS • Woorden tellen • TFIDF • Ngrams
  • 33. ONGESTRUCTUREERDE DATA: ANDERE TOEPASSINGEN • Klachtenanalyse • Analyse van foutmeldingen • Zoeken van informatie in tekstuele documenten • Juridisch Kennismanagement • Beeldherkenning
  • 34. YOUR CASE • Wat voor ongestructureerde data heb je in huis? • Wat voor externe data kan relevant zijn? • Is er een vraag die je met deze data zou kunnen beantwoorden? • Moet er daarvoor nog een interpretatieslag gemaakt worden?
  • 35. TAKE AWAYS • Er is gestructureerde en ongestructureerde data - Andere eigenschappen - Andere visualisaties • Ongestructureerde data moet nog ’geinterpreteerd’ worden: - Wie - Wat - Waar - Hoe
  • 36. CONCRETE PROJECTEN EN OPLEIDINGEN < Master Engineering Systems – Lean < Lean 4zero Master Applied Data Sciences > Lean & Robotica > < Digital factory Factory of the future >
  • 38. DANK VOOR JULLIE DEELNAME TIJD VOOR EEN DRANKJE..