Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
36. Bundeswettbewerb Informatik - DICE Data Science
1. 1
Das Fachgebiet Data Science
an der Universität Paderborn
25. September 2018
Adrian Wilke, Kevin Haack,
Zafar Habeeb Syed, Alexander Bigerl
dice.cs.upb.de
36. Bundeswettbewerb Informatik
bwinf.de/bundeswettbewerb
Web-Version
3. 3
Inhalte
Grundlagen Data Science
Adrian Wilke, 20 Minuten
Projektgruppe Search and Extraction:
Datenaufbereitung in modernen Unternehmen
Kevin Haack, 10 Minuten
Fact Checking
Zafar Habeeb Syed, 10 Minuten
Graph-Stores und Tensoren
Alexander Bigerl, 10 Minuten
Fachgebiet Data Science
11. Expressions-
daten von
Lungenkrebs-
patienten für
die Gene
HER2 und HER?
Data: TCGA (The Cancer Genome Atlas Database)
11
Saleemetal.(2014):Biglinkedcancerdata:IntegratinglinkedTCGAandPubMed.WebSemantics27
TCGA Daten
212,000 DVDs
33 Tumore
(Bild entfernt)
15. 15
Inhalte
Grundlagen Data Science
Adrian Wilke, 20 Minuten
Projektgruppe Search and Extraction:
Datenaufbereitung in modernen Unternehmen
Kevin Haack, 10 Minuten
Fact Checking
Zafar Habeeb Syed, 10 Minuten
Graph-Stores und Tensoren
Alexander Bigerl, 10 Minuten
Fachgebiet Data Science
17. SASK - Das Projekt
17
• Selbst organisiertes Softwareprojekt
• Internationale Studenten
• Ein Jahr
• SASK
– Verschiedene Quellen
– Wissen extrahieren
– Bereitstellen
20. 20
Inhalte
Grundlagen Data Science
Adrian Wilke, 20 Minuten
Projektgruppe Search and Extraction:
Datenaufbereitung in modernen Unternehmen
Kevin Haack, 10 Minuten
Fact Checking
Zafar Habeeb Syed, 10 Minuten
Graph-Stores und Tensoren
Alexander Bigerl, 10 Minuten
Fachgebiet Data Science
23. The Problem
23
Reasons for Misinformation?
Obama was born in Kenya
• Human errors
• Outdated facts
• Intention to spread fake news
MisinformationEasy to share
24. The Problem
24
Reasons for Misinformation?
• Human errors
• Outdated facts
• Intention to spread fake news
Problem formulation : Input
• Structured triples: <Shirin_Ebadi, award, Nobel_Peace_Prize>
• Unstructured textual claims:
“Did Franklin Graham Say ‘Attempted Rape Is Not a Crime’?”
Solution
Classify input claims as “True” or “False” by aggregating evidence
from different trustworthy sources.
MisinformationEasy to share
37. Denkaufgabe für Zuhause
3737
Gegeben:
● Tensor mit Rang n=3
● Kantenlänge von 109
● 10’000 Einträge ungleich 0
Was könnte eine gute Datenstruktur sein, um einen solchen Tensor
● effizient zu speichern
● Slices auszuführen
Beispiel:
● Array: Speicherbedarf 3·1019
TB
-> keine Option
Schreibt mir eure Ideen, ich gebe euch Feedback: bigerl ~ mail.upb.de
109
109
109