SlideShare a Scribd company logo
1 of 118
Download to read offline
Pengantar
ANALISIS DATA
ARIF RAHMAN
1
Referensi
 Milton, M, Head First: Data Analysis,
 Cielen, D, Meysman, ADB, & Ali, M, Introducing Data Science: Big Data,
Machine Learning, and More, Using Python Tools,
 Godsey, B, Think Like a Data Scientist: Tackle the Data Science Process
Step-by-Step,
 Skiena, SS, The Data Science Design Manual,
 Dietrich, D, Heller, B, & Yang, B, Data Science and Big Data Analytics:
Discovering, Analyzing, Visualizing and Presenting Data,
 Bahga, A, & Madisetti, V, Big Data Science and Analytics: A Hands-On
Approach,
 Steele, B, Chandler, J, & Reddy, S, Algorithms for Data Science,
 Russell, R. Machine Learning: Step-by-Step Guide to Implement Machine
Learning Algorithms with Python,
 Salazar, JR , Data Science and Analytics with Python,
 Miller, C, Hands-On Data Analysis with NumPy and Pandas: Implement
Python Packages from data Manipulation to Processing,
2
Referensi
3
Peranan Penting
Serta Problematik
Data dan Informasi
4
Kondratieff Waves
Cybernetics,
Wireless Technology,
Nanotechnology,
Biotechnology
Industrial Revolution
Water wheel,
Steam Engine
Chemicals,
Electricity,
Mechanics,
Petrochemicals
Fusion reaction,
Electronics,
Computers,
Mechatronics
Cybernetics,
Wireless Technology,
Nanotechnology,
Biotechnology
Revolusi Industri
Apakah ???
8
Internet of Things
Cloud Technology
Big Data
9
Cloud Computing Services
10
Big Data
11
Big Data
12
13
14
15
16
21
Analisis Data dimulai dari Keadaan Data
22
Penting memperhatikan
cara memperoleh
data yang akan diolah
Demikian pula
cara mengolah data
juga penting diperhatikan
Data LEMAH karena Sifat Internalnya
Data palsu, fiktif, manipulasi, dugaan, prediksi
Data dari sumber yang belum/tidak terpercaya
Data yang berubah, bertambah atau berkurang sepanjang
aliran perpindahan data
Data yang diambil dengan purposive sampling (misalnya memilih
sampel potensial untuk memperkuat pembuktian, untuk mengeksplorasi faktor, untuk
menentukan pemusatan data, untuk mengevaluasi pengaruh diversitas data, dll)
Data yang diambil dari populasi yang berbeda (misalnya berbeda
lingkup, karakteristik, situasi, perilaku, dll)
23
Data LEMAH karena Sifat Internalnya
24
Data LEMAH karena Kesalahan Pengukuran
Random error : kesalahan tak terkendali antar
pengukuran, karena faktor keacakan dari objek ukur,
operator, alat ukur, lingkungan atau noise lainnya.
Systematic error : kesalahan yang berulang dan
membiaskan hasil, karena kegagalan operator atau
alat ukur, kesalahan prosedur, pengaruh lingkungan
Illegitimate error : kesalahan insidental dan
menghasilkan outlier, karena keteledoran, keliru
kalkulasi, atau kesalahan lainnya
25
Data LEMAH karena Kesalahan Pengukuran
26
Data LEMAH karena Kesalahan Pengukuran
Unusual value (outlier), data yang sangat jauh dari
kumpulan data utama, karena illegitimate error
pengukuran atau mungkin sampel berasal dari
populasi lain (terdapat faktor yang berbeda).
Missing value, data relevan yang kurang atau tidak
lengkap, karena kealpaan pengukuran atau
pencatatannya, atau sebaran sampel kurang baik.
Bias, pergeseran data dari nilai yang sebenarnya,
karena systematic error pengukuran.
27
Data LEMAH karena Kesalahan Sampling
Random error : kesalahan sampling karena
sebaran sampel kurang merepresentasikan distribusi
populasi. → abandoned subset of population
Systematic error : kesalahan sampling karena
sampel terkumpul di sebagian populasi yang dibatasi
rentang waktu tertentu atau lokasi tertentu dan
melalaikan sebagian yang lain. → undercoverage
Illegitimate error : kesalahan sampling karena
sampel dari populasi yang berbeda → overcoverage
28
Data LEMAH karena Kesalahan Sampling
29
30
Tipe Data
31
Bagaimanakah data ???
Tunggal (univariate)
Bebas (independent)
Sama (homogen)
Tetap (fixed)
Statis
Pasti (certain)
Tertentu (deterministic)
Teratur/berpola (pattern)
...
Jamak (multivariate)
Terikat (dependent)
Berbeda (heterogen)
Berubah (variable)
Dinamis
Tidak pasti (uncertain)
Tak tentu (stochastic)
Acak (random)
...
32
Data
Data adalah fakta mentah yang diperoleh langsung
dari proses pengumpulan, yang perlu diolah lebih
lanjut untuk menghasilkan informasi yang memiliki
makna spesifik bagi pihak yang berkepentingan.
Data adalah bentuk jamak dari datum.
Datum adalah satu unit fakta mentah yang diperoleh
dari proses pengumpulan, misalnya hasil pengukuran
dalam observasi atau eksperimen.
33
Tipe Data
Kuantitatif dan Kualitatif
Parametrik dan Nonparametrik
Nominal, Ordinal, Interval dan Rasio
Diskrit dan Kontinyu
Serentak dan Deret waktu
Tunggal dan Berkelompok
Tunggal dan Jamak
34
Tipe Data
Data Kuantitatif atau Numerical, data yang diperoleh
dari pencacahan, penghitungan, pengukuran atau penilaian
dalam format angka atau bilangan yang dapat
diperbandingkan
Biner (0 atau 1) → data logik (true/false), data tanggapan (yes/no,
accept/decline), data kegagalan (sukses/gagal, baik/rusak)
Bilangan Bulat → Bil asli (1,2,...), Bil cacah (0,1,2)
Bilangan Nyata
...
35
Tipe Data
...
Data Kualitatif atau Categorical, data yang tidak
bernilai numerik.
Dikotomi
Pelabelan atau simbol
Klasifikasi atau stratifikasi
Penilaian verbal
36
Tipe Data
Data Parametrik, data kuantitatif yang mempunyai
sebaran variabel acak mengikuti pola distribusi
probabilitas dengan parameter tertentu (independent
and identically distributed random variables)
Data Nonparametrik, data yang tidak mempunyai
distribusi probabilitas (distribution-free) atau tiada
pengetahuan (sulit diperkirakan) mengenai distribusi
probabilitas populasinya
37
Tipe Data
Data Nominal, data yang hanya berupa simbol
(meski berupa angka) untuk membedakan nilainya
tanpa menunjukkan tingkatan
A = B ; A ≠ B
Contoh: jenis kelamin, warna kulit, ras, suku bangsa,
agama, bentuk rambut
...
38
Tipe Data
39
Tipe Data
Data Ordinal, data yang mempunyai nilai untuk
menunjukkan tingkatan, namun tanpa skala yang
baku dan jelas antar tingkatan.
A > B ; A < B
Contoh : Kelompok usia (bayi, anak-anak, remaja,
dewasa, manula), Tingkat pendidikan, Status
ekonomi, Tingkat kepentingan
...
40
Tipe Data
41
Tipe Data
Data Interval, data yang mempunyai nilai untuk
menunjukkan tingkatan dengan skala tertentu sesuai
intervalnya. Nilai nol hanya untuk menunjukkan titik
acuan (baseline).
A – B = C – D
Contoh : Temperatur, tingkat keasaman
...
42
Tipe Data
43
Tipe Data
Data Rasio, data yang mempunyai nilai untuk
menunjukkan tingkatan dengan skala indikasi rasio
perbandingan. Nilai nol menunjukkan titik asal (origin)
yang bernilai kosong (null).
A = k.B
Contoh : Tinggi badan, Berat badan, Banyaknya
orang, dll
44
Tipe Data
45
Tipe Data
Data Diskrit, data yang nilainya tertentu (certain),
jelas (distinct), terpisah gap (separate), dan dapat
tersusun di daftar (listed) yang berada dalam interval
tertentu, meskipun bisa dengan batas tak hingga
(misalnya: x = 1, 2, 3, ...).
Biasanya data hasil pencacahan atau penghitungan,
dalam angka bilangan cacah (whole numbers),
misalnya banyaknya orang. Meskipun ada pula data
yang menunjukkan ukuran spesifik, misalnya ukuran
sepatu, ukuran kemeja, ukuran celana.
46
Tipe Data
Data Kontinyu, data yang nilainya tersebar (any
value at any point), tersambung tiada gap
(continuum), dan sulit tersusun di daftar (cannot be
listed) yang berada dalam interval tertentu, meskipun
bisa dengan batas tak hingga (misalnya: x > 0).
Biasanya adalah data hasil pengukuran, dalam angka
bilangan nyata (real numbers), misalnya panjang
meja, volume cairan. Meskipun dapat pula dibulatkan,
data pengukuran yang lebih teliti juga masih mungkin
diperoleh, misalnya 2,5 cm ≈ 2,482468... cm.
47
Tipe Data
48
Tipe Data
49
Pengukuran
Data Diskrit
Pengukuran
Data Kontinyu
Tipe Data
Data serentak (cross sectional) adalah data yang
diperoleh dari observasi pada waktu yang sama atau
dalam jeda waktu yang tidak signifikan, karena
diasumsikan data tidak sensitif terhadap pergerakan
waktu.
Data deret waktu (time series) adalah data yang
diperoleh dari observasi dengan mempertimbangkan
pergerakan waktu, dan biasanya disertai dugaan
bahwa data dipengaruhi oleh waktu.
50
Tipe Data
Data tunggal (ungrouped data) adalah data mentah
yang belum terorganisasi dalam kelompok atau grup.
Data berkelompok (grouped data) adalah data
yang terorganisasi dalam kelompok atau grup.
 Klaster (clustered data). Pengelompokan data berdasarkan kategori dari variabel
lain (yang terikat dengan data), sehingga data dalam satu klaster masih
heterogen, dan antar klaster bisa serupa atau beririsan.
 Kategori (categorical data). Pengelompokan data berdasarkan kategori nominal
dari data itu sendiri, sehingga data dalam satu klaster sudah homogen, dan antar
klaster berbeda dan tidak beririsan.
 Strata (stratified data). Pengelompokan data berdasarkan stratum atau kelas
berjenjang dari data mulai kelas terkecil hingga terbesar.
51
Tipe Data
52
Tipe Data
53
Data Berkelompok
Pengendalian
Kualitas
Statistik
Eksperimen satu faktor
dan Regresi Linier
(Klaster)
(Kategori atau
Strata)
Tipe Data
Data tunggal (univariate data) adalah data yang
hanya merepresentasikan satu variabel.
Data jamak (multivariate data) adalah data yang
merepresentasikan pasangan atau himpunan dari
dua atau lebih variabel secara simultan dengan
mempertimbangkan hubungan antar variabelnya.
54
Tipe Data
55
ID A1 B1 A2 C1 B2 B3 A3 C2 B4 C3 B5 C4 A4 A5 A6 C5 B6 C6 C7 C8
Klaster A B A C B B A C B C B C A A A C B C C C
Warna H H C C B B H H M M H C B M C B M B C H
Intensitas S T T S S T T G S T T G T G S G S T G T
Masing-masing baris adalah data univariate Gabungan 2 atau lebih baris adalah data multivariate
Distribusi data univariate Distribusi data multivariate
Plot data bivariate
Plot data multivariate
Tipe Data
56
Plot data univariate
Plot data multivariate
Jenis Data Berdasarkan Sumber Data
Data primer, fakta yang diperoleh langsung dari
pengukuran atau penghitungan obyek observasi
Data sekunder, data yang diperoleh dari merujuk
hasil observasi atau pernyataan subyek observasi
atau responden (melalui wawancara atau curah
pendapat)
Data tersier, dst..., data yang diperoleh dari pustaka
lainnya.
57
Tipe Data
Record
Data Matrix
Document Data
Transaction Data
Graph
World Wide Web
Molecular Structures
Ordered
Spatial Data
Temporal Data
Sequential Data
Genetic Sequence Data
58
Record Data
Record Data adalah data yang
terdiri dari sejumlah record
atau tuple atau instance, yang
mana setiap record tersusun
dari satu set atribut tertentu
59
Tid Refund Marital
Status
Taxable
Income Cheat
1 Yes Single 125K No
2 No Married 100K No
3 No Single 70K No
4 Yes Married 120K No
5 No Divorced 95K Yes
6 No Married 60K No
7 Yes Divorced 220K No
8 No Single 85K Yes
9 No Married 75K No
10 No Single 90K Yes
10
Graph Data
Graph data adalah data yang menjelaskan node dan relasinya
contoh: Generic graph, a molecule, dan webpages sitemaps
60
5
2
1
2
5
Benzene Molecule: C6H6
Ordered Data
Ordered Data adalah data yang menunjukkan rangkaian urutan
Sequences of transactions
An element of the sequence
Items/Events
61
Ordered Data
 Genomic sequence data
GGTTCCGCCTTCAGCCCCGCGCC
CGCAGGGCCCGCCCCGCGCCGTC
GAGAAGGGCCCGCCTGGCGGGCG
GGGGGAGGCGGGGCCGCCCGAGC
CCAACCGAGTCCGACCAGGTGCC
CCCTCTGCTCGGCCTAGACCTGA
GCTCATTAGGCGGCAGCGGACAG
GCCAAGTAGAACACGCGAAGCGC
TGGGCTGCCTGCTGCGACCAGGG
62
Ordered Data
Spatio-Temporal Data
Average Monthly
Temperature of
land and ocean
63
64
Biometrics
65
Jenjang
Data – Informasi
66
67
Apakah ???
68
Apakah ???
69
Apakah ???
Bagaimanakah pola data ???
Mengumpul
Konstan
Stasioner
Kovergen
Mempunyai tren
Seragam (uniformity)
Koheren
Stereotype
Jelas (distinct)
...
Menyebar
Berfluktuasi
Non-stasioner
Divergen
Acak
Beragam (diversity)
Kacau
Anomali
Tak jelas (fuzzy)
...
71
Sekilas tentang
Data Science
72
73
Data Science
Data Science adalah disiplin ilmu interdisipliner yang
menggunakan metode ilmiah, algoritma, proses saintifik, dan
pendekatan sistem untuk mengekstrak knowledge dan insight
dari data yang terstruktur atau tidak terstruktur, terorganisasi
atau tercampur-baur, serta menerapkan knowledge dan
insight berbasis data di berbagai domain.
Data Science membutuhkan pengetahuan dan keterampilan:
Matematika dan statistika
Ilmu komputer dan informatika
Domain knowledge (pengetahuan terhadap domain baik dari
keilmuan maupun praktik aplikasi)
74
75
76
77
78
79
80
81
Data Science
Data science memadukan banyak bidang ilmu, mencakup
statistika, metode ilmiah, kecerdasan buatan (artificial
intelligence, AI), dan analisa data untuk mengekstraksi nilai
informasi dari data.
https://www.oracle.com/data-science/what-is-data-science/
Data science memadukan metode ilmiah, matematika dan
statistika, pemrograman, analisa data, kecerdasan buatan
(artificial intelligence, AI), dan storytelling untuk mengungkap
dan menjelaskan business insights yang tersembunyi di data.
https://www.ibm.com/cloud/learn/data-science-introduction
82
83
84
KDD: Knowledge Discovery and Data Mining AI: Artificial Intelligence
Data Science
Data Science berkaitan dengan ekstraksi, preparasi,
analisis, visualisasi dan maintain informasi. Merupakan
disiplin ilmu lintas disipliner yang menggunakan metode
ilmiah dan proses saintifik untuk menarik insights dari data.
Data Science berkepentingan dengan pengolahan, analisis
dan ekstraksi data untuk menghasilkan insights dari data
menggunakan berbagai metode statistika dan algoritma
komputer. Merupakan disiplin ilmu multidisipliner yang
memadukan matematika, statistika dan ilmu komputer.
https://data-flair.training/blogs/what-is-data-science/
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
Data Science-Data Analysis
What is Data Science?
Data Science adalah disiplin ilmu multidisipliner yang memadukan banyak disiplin
ilmu berkaitan dengan data dan mengaplikasikan tool dan metode interdisipliner
untuk ekstraksi, preparasi, analisis, visualisasi dan maintain data terstruktur atau tak
terstruktur untuk menghasilkan knowledge dan insight dari data.
What is Data Analysis?
Data analysis adalah bagian dari Data Science yang berkaitan dengan pemilihan
dan pengaplikasian tool dan metode analisis yang tepat untuk menghasilkan
knowledge dan insight dari data.
101
Data Science-Data Analysis
What is Data Analytics?
Data Analytics adalah bagian dari Data Analysis yang menggunakan query dan
metode agregasi data untuk memetakan berbagai pola relasi dan dependensi antar
variabel input.
What is Data Mining?
Data Mining adalah metode yang dipergunakan dalam Data Analytics yang
memberdayakan kemampuan prediksi dari machine learning dengan
mengaplikasikan berbagai algoritma machine learning atas big data untuk
mengidentifikasikan pola kecenderungan dari data.
102
103
104
Sekilas tentang
Machine Learning
105
Artificial Intelligence
106
107
108
109
110
111
112
113
114
115
116
Artificial Intelligence-Machine Learning
What is Artificial Intelligence?
Artifial Intelligence adalah teknik dalam disiplin ilmu komputer yang memungkinkan
komputer menirukan kecerdasan manusia, menggunakan logika, aturan if-then,
pohon keputusan, dan model keputusan lainnya, termasuk machine learning.
What is Machine Learning?
Machine Learning adalah bagian dari Artificial Intelligence yang melibatkan teknik
statistika probabilistik sehingga memungkinkan mesin untuk meningkatkan
kemampuan algoritma komputer menjalankan tugas dengan pengalaman.
What is Deep Learning?
Deep Learning adalah bagian dari Machine Learning yang memadukan algoritma
yang memungkinkan software untuk melatih mandiri hingga mampu menjalankan
tugas dengan menerapkan multilayered neural network pada data skala besar.
117
118
Terima kasih ...
... Ada pertanyaan ???

More Related Content

Similar to Pengantar Analisis Data - Modul Ajar Kuliah Analisis Data 01

TM5-statistika_5 pengenalan statistik deskriptif
TM5-statistika_5 pengenalan statistik deskriptifTM5-statistika_5 pengenalan statistik deskriptif
TM5-statistika_5 pengenalan statistik deskriptifYogiRabani1
 
TM5-statistika_5.ppt
TM5-statistika_5.pptTM5-statistika_5.ppt
TM5-statistika_5.pptMiffJasenx
 
bahan matakuliah probabilitas dan statistik.ppt
bahan matakuliah probabilitas dan statistik.pptbahan matakuliah probabilitas dan statistik.ppt
bahan matakuliah probabilitas dan statistik.pptssuser13daca1
 
TM5-statistika_5.ppt wiwiwiwiwiiwiwwiwiwiw
TM5-statistika_5.ppt wiwiwiwiwiiwiwwiwiwiwTM5-statistika_5.ppt wiwiwiwiwiiwiwwiwiwiw
TM5-statistika_5.ppt wiwiwiwiwiiwiwwiwiwiwRahmanPrasetyo3
 
0. pengantar statistika.pptx
0. pengantar statistika.pptx0. pengantar statistika.pptx
0. pengantar statistika.pptxAliMahsun6
 
Statistik matematika by " Dra.Hj. Aty Nurdiana , M.Pd
Statistik matematika by " Dra.Hj. Aty Nurdiana , M.PdStatistik matematika by " Dra.Hj. Aty Nurdiana , M.Pd
Statistik matematika by " Dra.Hj. Aty Nurdiana , M.PdDESI PRAYOGO
 
Statistika dan probabilitas
Statistika dan probabilitasStatistika dan probabilitas
Statistika dan probabilitasUFDK
 
STATISTIKA DESKRIPTIF P3.ppt
STATISTIKA DESKRIPTIF P3.pptSTATISTIKA DESKRIPTIF P3.ppt
STATISTIKA DESKRIPTIF P3.pptArnita Piliang
 
PERTEMUAN 1-3.pot.pptx
PERTEMUAN 1-3.pot.pptxPERTEMUAN 1-3.pot.pptx
PERTEMUAN 1-3.pot.pptxSuryaFahrozi2
 
Pengantar statistik
Pengantar statistikPengantar statistik
Pengantar statistikHafiza .h
 
5. MATERI KULIAH STATISTIK_PENDIDIKAN.pptx
5. MATERI KULIAH STATISTIK_PENDIDIKAN.pptx5. MATERI KULIAH STATISTIK_PENDIDIKAN.pptx
5. MATERI KULIAH STATISTIK_PENDIDIKAN.pptxlilikeffendi
 
1. peranan statistik dan penyajian data
1. peranan statistik dan penyajian data1. peranan statistik dan penyajian data
1. peranan statistik dan penyajian dataNanda Reda
 
MODUL-1(090523)-compressed (2).pdf
MODUL-1(090523)-compressed (2).pdfMODUL-1(090523)-compressed (2).pdf
MODUL-1(090523)-compressed (2).pdfssuser411ce8
 

Similar to Pengantar Analisis Data - Modul Ajar Kuliah Analisis Data 01 (20)

TM5-statistika_5 pengenalan statistik deskriptif
TM5-statistika_5 pengenalan statistik deskriptifTM5-statistika_5 pengenalan statistik deskriptif
TM5-statistika_5 pengenalan statistik deskriptif
 
TM5-statistika_5.ppt
TM5-statistika_5.pptTM5-statistika_5.ppt
TM5-statistika_5.ppt
 
bahan matakuliah probabilitas dan statistik.ppt
bahan matakuliah probabilitas dan statistik.pptbahan matakuliah probabilitas dan statistik.ppt
bahan matakuliah probabilitas dan statistik.ppt
 
TM5-statistika_5.ppt wiwiwiwiwiiwiwwiwiwiw
TM5-statistika_5.ppt wiwiwiwiwiiwiwwiwiwiwTM5-statistika_5.ppt wiwiwiwiwiiwiwwiwiwiw
TM5-statistika_5.ppt wiwiwiwiwiiwiwwiwiwiw
 
0. pengantar statistika.pptx
0. pengantar statistika.pptx0. pengantar statistika.pptx
0. pengantar statistika.pptx
 
1 5 statistika - nafiu
1 5 statistika - nafiu1 5 statistika - nafiu
1 5 statistika - nafiu
 
2. STATISTIK INDUSTRI - STATISTIK DESKRIPTIF
2. STATISTIK INDUSTRI - STATISTIK DESKRIPTIF2. STATISTIK INDUSTRI - STATISTIK DESKRIPTIF
2. STATISTIK INDUSTRI - STATISTIK DESKRIPTIF
 
Statistik matematika by " Dra.Hj. Aty Nurdiana , M.Pd
Statistik matematika by " Dra.Hj. Aty Nurdiana , M.PdStatistik matematika by " Dra.Hj. Aty Nurdiana , M.Pd
Statistik matematika by " Dra.Hj. Aty Nurdiana , M.Pd
 
Statistika dan probabilitas
Statistika dan probabilitasStatistika dan probabilitas
Statistika dan probabilitas
 
STATISTIKA DESKRIPTIF P3.ppt
STATISTIKA DESKRIPTIF P3.pptSTATISTIKA DESKRIPTIF P3.ppt
STATISTIKA DESKRIPTIF P3.ppt
 
STATISTIKA
STATISTIKASTATISTIKA
STATISTIKA
 
Statistika
StatistikaStatistika
Statistika
 
Silabus Statistik 1
Silabus Statistik 1Silabus Statistik 1
Silabus Statistik 1
 
Materi 1-statistika 5
Materi 1-statistika 5Materi 1-statistika 5
Materi 1-statistika 5
 
PERTEMUAN 1-3.pot.pptx
PERTEMUAN 1-3.pot.pptxPERTEMUAN 1-3.pot.pptx
PERTEMUAN 1-3.pot.pptx
 
Pengantar Statistik
Pengantar StatistikPengantar Statistik
Pengantar Statistik
 
Pengantar statistik
Pengantar statistikPengantar statistik
Pengantar statistik
 
5. MATERI KULIAH STATISTIK_PENDIDIKAN.pptx
5. MATERI KULIAH STATISTIK_PENDIDIKAN.pptx5. MATERI KULIAH STATISTIK_PENDIDIKAN.pptx
5. MATERI KULIAH STATISTIK_PENDIDIKAN.pptx
 
1. peranan statistik dan penyajian data
1. peranan statistik dan penyajian data1. peranan statistik dan penyajian data
1. peranan statistik dan penyajian data
 
MODUL-1(090523)-compressed (2).pdf
MODUL-1(090523)-compressed (2).pdfMODUL-1(090523)-compressed (2).pdf
MODUL-1(090523)-compressed (2).pdf
 

More from Arif Rahman

Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07Arif Rahman
 
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06Arif Rahman
 
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...Arif Rahman
 
Proses Data Science - Modul Ajar Kuliah Analisis Data 02
Proses Data Science - Modul Ajar Kuliah Analisis Data 02Proses Data Science - Modul Ajar Kuliah Analisis Data 02
Proses Data Science - Modul Ajar Kuliah Analisis Data 02Arif Rahman
 
Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...
Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...
Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...
Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...
Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...
Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...
Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-10: Analisis Regresi Nonlinier
Modul Ajar Statistika Inferensia ke-10: Analisis Regresi NonlinierModul Ajar Statistika Inferensia ke-10: Analisis Regresi Nonlinier
Modul Ajar Statistika Inferensia ke-10: Analisis Regresi NonlinierArif Rahman
 
Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...
Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...
Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...
Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...
Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...
Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...
Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...
Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...
Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik
Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata NonparametrikModul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik
Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata NonparametrikArif Rahman
 
Modul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi Parametrik
Modul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi ParametrikModul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi Parametrik
Modul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi ParametrikArif Rahman
 
Modul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi Parametrik
Modul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi ParametrikModul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi Parametrik
Modul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi ParametrikArif Rahman
 
Modul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata Parametrik
Modul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata ParametrikModul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata Parametrik
Modul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata ParametrikArif Rahman
 
Modul Ajar Statistika Inferensia ke-1: Pengantar Statistika Inferensia
Modul Ajar Statistika Inferensia ke-1: Pengantar Statistika InferensiaModul Ajar Statistika Inferensia ke-1: Pengantar Statistika Inferensia
Modul Ajar Statistika Inferensia ke-1: Pengantar Statistika InferensiaArif Rahman
 
Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...
Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...
Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...Arif Rahman
 
Doe15 factorialmixed
Doe15 factorialmixedDoe15 factorialmixed
Doe15 factorialmixedArif Rahman
 
Doe14 factorial3k fractional
Doe14 factorial3k fractionalDoe14 factorial3k fractional
Doe14 factorial3k fractionalArif Rahman
 

More from Arif Rahman (20)

Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07
 
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
 
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
 
Proses Data Science - Modul Ajar Kuliah Analisis Data 02
Proses Data Science - Modul Ajar Kuliah Analisis Data 02Proses Data Science - Modul Ajar Kuliah Analisis Data 02
Proses Data Science - Modul Ajar Kuliah Analisis Data 02
 
Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...
Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...
Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...
 
Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...
Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...
Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...
 
Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...
Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...
Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...
 
Modul Ajar Statistika Inferensia ke-10: Analisis Regresi Nonlinier
Modul Ajar Statistika Inferensia ke-10: Analisis Regresi NonlinierModul Ajar Statistika Inferensia ke-10: Analisis Regresi Nonlinier
Modul Ajar Statistika Inferensia ke-10: Analisis Regresi Nonlinier
 
Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...
Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...
Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...
 
Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...
Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...
Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...
 
Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...
Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...
Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...
 
Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...
Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...
Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...
 
Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik
Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata NonparametrikModul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik
Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik
 
Modul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi Parametrik
Modul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi ParametrikModul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi Parametrik
Modul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi Parametrik
 
Modul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi Parametrik
Modul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi ParametrikModul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi Parametrik
Modul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi Parametrik
 
Modul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata Parametrik
Modul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata ParametrikModul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata Parametrik
Modul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata Parametrik
 
Modul Ajar Statistika Inferensia ke-1: Pengantar Statistika Inferensia
Modul Ajar Statistika Inferensia ke-1: Pengantar Statistika InferensiaModul Ajar Statistika Inferensia ke-1: Pengantar Statistika Inferensia
Modul Ajar Statistika Inferensia ke-1: Pengantar Statistika Inferensia
 
Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...
Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...
Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...
 
Doe15 factorialmixed
Doe15 factorialmixedDoe15 factorialmixed
Doe15 factorialmixed
 
Doe14 factorial3k fractional
Doe14 factorial3k fractionalDoe14 factorial3k fractional
Doe14 factorial3k fractional
 

Recently uploaded

Strategi Pengembangan Agribisnis di Indonesia
Strategi Pengembangan Agribisnis di IndonesiaStrategi Pengembangan Agribisnis di Indonesia
Strategi Pengembangan Agribisnis di IndonesiaRenaYunita2
 
001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx
001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx
001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptxMuhararAhmad
 
TEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdf
TEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdfTEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdf
TEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdfYogiCahyoPurnomo
 
MAteri:Penggunaan fungsi pada pemrograman c++
MAteri:Penggunaan fungsi pada pemrograman c++MAteri:Penggunaan fungsi pada pemrograman c++
MAteri:Penggunaan fungsi pada pemrograman c++FujiAdam
 
materi pengendalian proyek konstruksi.pptx
materi pengendalian proyek konstruksi.pptxmateri pengendalian proyek konstruksi.pptx
materi pengendalian proyek konstruksi.pptxsiswoST
 
Slide Transformasi dan Load Data Menggunakan Talend Open Studio
Slide Transformasi dan Load Data Menggunakan Talend Open StudioSlide Transformasi dan Load Data Menggunakan Talend Open Studio
Slide Transformasi dan Load Data Menggunakan Talend Open Studiossuser52d6bf
 
Pembangkit Listrik Tenaga Nuklir Kelompok 1.pptx
Pembangkit Listrik Tenaga Nuklir Kelompok 1.pptxPembangkit Listrik Tenaga Nuklir Kelompok 1.pptx
Pembangkit Listrik Tenaga Nuklir Kelompok 1.pptxmuhammadrizky331164
 
Manual Desain Perkerasan jalan 2017 FINAL.pptx
Manual Desain Perkerasan jalan 2017 FINAL.pptxManual Desain Perkerasan jalan 2017 FINAL.pptx
Manual Desain Perkerasan jalan 2017 FINAL.pptxRemigius1984
 

Recently uploaded (8)

Strategi Pengembangan Agribisnis di Indonesia
Strategi Pengembangan Agribisnis di IndonesiaStrategi Pengembangan Agribisnis di Indonesia
Strategi Pengembangan Agribisnis di Indonesia
 
001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx
001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx
001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx
 
TEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdf
TEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdfTEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdf
TEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdf
 
MAteri:Penggunaan fungsi pada pemrograman c++
MAteri:Penggunaan fungsi pada pemrograman c++MAteri:Penggunaan fungsi pada pemrograman c++
MAteri:Penggunaan fungsi pada pemrograman c++
 
materi pengendalian proyek konstruksi.pptx
materi pengendalian proyek konstruksi.pptxmateri pengendalian proyek konstruksi.pptx
materi pengendalian proyek konstruksi.pptx
 
Slide Transformasi dan Load Data Menggunakan Talend Open Studio
Slide Transformasi dan Load Data Menggunakan Talend Open StudioSlide Transformasi dan Load Data Menggunakan Talend Open Studio
Slide Transformasi dan Load Data Menggunakan Talend Open Studio
 
Pembangkit Listrik Tenaga Nuklir Kelompok 1.pptx
Pembangkit Listrik Tenaga Nuklir Kelompok 1.pptxPembangkit Listrik Tenaga Nuklir Kelompok 1.pptx
Pembangkit Listrik Tenaga Nuklir Kelompok 1.pptx
 
Manual Desain Perkerasan jalan 2017 FINAL.pptx
Manual Desain Perkerasan jalan 2017 FINAL.pptxManual Desain Perkerasan jalan 2017 FINAL.pptx
Manual Desain Perkerasan jalan 2017 FINAL.pptx
 

Pengantar Analisis Data - Modul Ajar Kuliah Analisis Data 01

  • 2. Referensi  Milton, M, Head First: Data Analysis,  Cielen, D, Meysman, ADB, & Ali, M, Introducing Data Science: Big Data, Machine Learning, and More, Using Python Tools,  Godsey, B, Think Like a Data Scientist: Tackle the Data Science Process Step-by-Step,  Skiena, SS, The Data Science Design Manual,  Dietrich, D, Heller, B, & Yang, B, Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data,  Bahga, A, & Madisetti, V, Big Data Science and Analytics: A Hands-On Approach,  Steele, B, Chandler, J, & Reddy, S, Algorithms for Data Science,  Russell, R. Machine Learning: Step-by-Step Guide to Implement Machine Learning Algorithms with Python,  Salazar, JR , Data Science and Analytics with Python,  Miller, C, Hands-On Data Analysis with NumPy and Pandas: Implement Python Packages from data Manipulation to Processing, 2
  • 6. Industrial Revolution Water wheel, Steam Engine Chemicals, Electricity, Mechanics, Petrochemicals Fusion reaction, Electronics, Computers, Mechatronics Cybernetics, Wireless Technology, Nanotechnology, Biotechnology
  • 8. Apakah ??? 8 Internet of Things Cloud Technology Big Data
  • 9. 9
  • 13. 13
  • 14. 14
  • 15. 15
  • 16. 16
  • 17.
  • 18.
  • 19.
  • 20.
  • 21. 21
  • 22. Analisis Data dimulai dari Keadaan Data 22 Penting memperhatikan cara memperoleh data yang akan diolah Demikian pula cara mengolah data juga penting diperhatikan
  • 23. Data LEMAH karena Sifat Internalnya Data palsu, fiktif, manipulasi, dugaan, prediksi Data dari sumber yang belum/tidak terpercaya Data yang berubah, bertambah atau berkurang sepanjang aliran perpindahan data Data yang diambil dengan purposive sampling (misalnya memilih sampel potensial untuk memperkuat pembuktian, untuk mengeksplorasi faktor, untuk menentukan pemusatan data, untuk mengevaluasi pengaruh diversitas data, dll) Data yang diambil dari populasi yang berbeda (misalnya berbeda lingkup, karakteristik, situasi, perilaku, dll) 23
  • 24. Data LEMAH karena Sifat Internalnya 24
  • 25. Data LEMAH karena Kesalahan Pengukuran Random error : kesalahan tak terkendali antar pengukuran, karena faktor keacakan dari objek ukur, operator, alat ukur, lingkungan atau noise lainnya. Systematic error : kesalahan yang berulang dan membiaskan hasil, karena kegagalan operator atau alat ukur, kesalahan prosedur, pengaruh lingkungan Illegitimate error : kesalahan insidental dan menghasilkan outlier, karena keteledoran, keliru kalkulasi, atau kesalahan lainnya 25
  • 26. Data LEMAH karena Kesalahan Pengukuran 26
  • 27. Data LEMAH karena Kesalahan Pengukuran Unusual value (outlier), data yang sangat jauh dari kumpulan data utama, karena illegitimate error pengukuran atau mungkin sampel berasal dari populasi lain (terdapat faktor yang berbeda). Missing value, data relevan yang kurang atau tidak lengkap, karena kealpaan pengukuran atau pencatatannya, atau sebaran sampel kurang baik. Bias, pergeseran data dari nilai yang sebenarnya, karena systematic error pengukuran. 27
  • 28. Data LEMAH karena Kesalahan Sampling Random error : kesalahan sampling karena sebaran sampel kurang merepresentasikan distribusi populasi. → abandoned subset of population Systematic error : kesalahan sampling karena sampel terkumpul di sebagian populasi yang dibatasi rentang waktu tertentu atau lokasi tertentu dan melalaikan sebagian yang lain. → undercoverage Illegitimate error : kesalahan sampling karena sampel dari populasi yang berbeda → overcoverage 28
  • 29. Data LEMAH karena Kesalahan Sampling 29
  • 30. 30
  • 32. Bagaimanakah data ??? Tunggal (univariate) Bebas (independent) Sama (homogen) Tetap (fixed) Statis Pasti (certain) Tertentu (deterministic) Teratur/berpola (pattern) ... Jamak (multivariate) Terikat (dependent) Berbeda (heterogen) Berubah (variable) Dinamis Tidak pasti (uncertain) Tak tentu (stochastic) Acak (random) ... 32
  • 33. Data Data adalah fakta mentah yang diperoleh langsung dari proses pengumpulan, yang perlu diolah lebih lanjut untuk menghasilkan informasi yang memiliki makna spesifik bagi pihak yang berkepentingan. Data adalah bentuk jamak dari datum. Datum adalah satu unit fakta mentah yang diperoleh dari proses pengumpulan, misalnya hasil pengukuran dalam observasi atau eksperimen. 33
  • 34. Tipe Data Kuantitatif dan Kualitatif Parametrik dan Nonparametrik Nominal, Ordinal, Interval dan Rasio Diskrit dan Kontinyu Serentak dan Deret waktu Tunggal dan Berkelompok Tunggal dan Jamak 34
  • 35. Tipe Data Data Kuantitatif atau Numerical, data yang diperoleh dari pencacahan, penghitungan, pengukuran atau penilaian dalam format angka atau bilangan yang dapat diperbandingkan Biner (0 atau 1) → data logik (true/false), data tanggapan (yes/no, accept/decline), data kegagalan (sukses/gagal, baik/rusak) Bilangan Bulat → Bil asli (1,2,...), Bil cacah (0,1,2) Bilangan Nyata ... 35
  • 36. Tipe Data ... Data Kualitatif atau Categorical, data yang tidak bernilai numerik. Dikotomi Pelabelan atau simbol Klasifikasi atau stratifikasi Penilaian verbal 36
  • 37. Tipe Data Data Parametrik, data kuantitatif yang mempunyai sebaran variabel acak mengikuti pola distribusi probabilitas dengan parameter tertentu (independent and identically distributed random variables) Data Nonparametrik, data yang tidak mempunyai distribusi probabilitas (distribution-free) atau tiada pengetahuan (sulit diperkirakan) mengenai distribusi probabilitas populasinya 37
  • 38. Tipe Data Data Nominal, data yang hanya berupa simbol (meski berupa angka) untuk membedakan nilainya tanpa menunjukkan tingkatan A = B ; A ≠ B Contoh: jenis kelamin, warna kulit, ras, suku bangsa, agama, bentuk rambut ... 38
  • 40. Tipe Data Data Ordinal, data yang mempunyai nilai untuk menunjukkan tingkatan, namun tanpa skala yang baku dan jelas antar tingkatan. A > B ; A < B Contoh : Kelompok usia (bayi, anak-anak, remaja, dewasa, manula), Tingkat pendidikan, Status ekonomi, Tingkat kepentingan ... 40
  • 42. Tipe Data Data Interval, data yang mempunyai nilai untuk menunjukkan tingkatan dengan skala tertentu sesuai intervalnya. Nilai nol hanya untuk menunjukkan titik acuan (baseline). A – B = C – D Contoh : Temperatur, tingkat keasaman ... 42
  • 44. Tipe Data Data Rasio, data yang mempunyai nilai untuk menunjukkan tingkatan dengan skala indikasi rasio perbandingan. Nilai nol menunjukkan titik asal (origin) yang bernilai kosong (null). A = k.B Contoh : Tinggi badan, Berat badan, Banyaknya orang, dll 44
  • 46. Tipe Data Data Diskrit, data yang nilainya tertentu (certain), jelas (distinct), terpisah gap (separate), dan dapat tersusun di daftar (listed) yang berada dalam interval tertentu, meskipun bisa dengan batas tak hingga (misalnya: x = 1, 2, 3, ...). Biasanya data hasil pencacahan atau penghitungan, dalam angka bilangan cacah (whole numbers), misalnya banyaknya orang. Meskipun ada pula data yang menunjukkan ukuran spesifik, misalnya ukuran sepatu, ukuran kemeja, ukuran celana. 46
  • 47. Tipe Data Data Kontinyu, data yang nilainya tersebar (any value at any point), tersambung tiada gap (continuum), dan sulit tersusun di daftar (cannot be listed) yang berada dalam interval tertentu, meskipun bisa dengan batas tak hingga (misalnya: x > 0). Biasanya adalah data hasil pengukuran, dalam angka bilangan nyata (real numbers), misalnya panjang meja, volume cairan. Meskipun dapat pula dibulatkan, data pengukuran yang lebih teliti juga masih mungkin diperoleh, misalnya 2,5 cm ≈ 2,482468... cm. 47
  • 50. Tipe Data Data serentak (cross sectional) adalah data yang diperoleh dari observasi pada waktu yang sama atau dalam jeda waktu yang tidak signifikan, karena diasumsikan data tidak sensitif terhadap pergerakan waktu. Data deret waktu (time series) adalah data yang diperoleh dari observasi dengan mempertimbangkan pergerakan waktu, dan biasanya disertai dugaan bahwa data dipengaruhi oleh waktu. 50
  • 51. Tipe Data Data tunggal (ungrouped data) adalah data mentah yang belum terorganisasi dalam kelompok atau grup. Data berkelompok (grouped data) adalah data yang terorganisasi dalam kelompok atau grup.  Klaster (clustered data). Pengelompokan data berdasarkan kategori dari variabel lain (yang terikat dengan data), sehingga data dalam satu klaster masih heterogen, dan antar klaster bisa serupa atau beririsan.  Kategori (categorical data). Pengelompokan data berdasarkan kategori nominal dari data itu sendiri, sehingga data dalam satu klaster sudah homogen, dan antar klaster berbeda dan tidak beririsan.  Strata (stratified data). Pengelompokan data berdasarkan stratum atau kelas berjenjang dari data mulai kelas terkecil hingga terbesar. 51
  • 53. Tipe Data 53 Data Berkelompok Pengendalian Kualitas Statistik Eksperimen satu faktor dan Regresi Linier (Klaster) (Kategori atau Strata)
  • 54. Tipe Data Data tunggal (univariate data) adalah data yang hanya merepresentasikan satu variabel. Data jamak (multivariate data) adalah data yang merepresentasikan pasangan atau himpunan dari dua atau lebih variabel secara simultan dengan mempertimbangkan hubungan antar variabelnya. 54
  • 55. Tipe Data 55 ID A1 B1 A2 C1 B2 B3 A3 C2 B4 C3 B5 C4 A4 A5 A6 C5 B6 C6 C7 C8 Klaster A B A C B B A C B C B C A A A C B C C C Warna H H C C B B H H M M H C B M C B M B C H Intensitas S T T S S T T G S T T G T G S G S T G T Masing-masing baris adalah data univariate Gabungan 2 atau lebih baris adalah data multivariate Distribusi data univariate Distribusi data multivariate Plot data bivariate Plot data multivariate
  • 56. Tipe Data 56 Plot data univariate Plot data multivariate
  • 57. Jenis Data Berdasarkan Sumber Data Data primer, fakta yang diperoleh langsung dari pengukuran atau penghitungan obyek observasi Data sekunder, data yang diperoleh dari merujuk hasil observasi atau pernyataan subyek observasi atau responden (melalui wawancara atau curah pendapat) Data tersier, dst..., data yang diperoleh dari pustaka lainnya. 57
  • 58. Tipe Data Record Data Matrix Document Data Transaction Data Graph World Wide Web Molecular Structures Ordered Spatial Data Temporal Data Sequential Data Genetic Sequence Data 58
  • 59. Record Data Record Data adalah data yang terdiri dari sejumlah record atau tuple atau instance, yang mana setiap record tersusun dari satu set atribut tertentu 59 Tid Refund Marital Status Taxable Income Cheat 1 Yes Single 125K No 2 No Married 100K No 3 No Single 70K No 4 Yes Married 120K No 5 No Divorced 95K Yes 6 No Married 60K No 7 Yes Divorced 220K No 8 No Single 85K Yes 9 No Married 75K No 10 No Single 90K Yes 10
  • 60. Graph Data Graph data adalah data yang menjelaskan node dan relasinya contoh: Generic graph, a molecule, dan webpages sitemaps 60 5 2 1 2 5 Benzene Molecule: C6H6
  • 61. Ordered Data Ordered Data adalah data yang menunjukkan rangkaian urutan Sequences of transactions An element of the sequence Items/Events 61
  • 62. Ordered Data  Genomic sequence data GGTTCCGCCTTCAGCCCCGCGCC CGCAGGGCCCGCCCCGCGCCGTC GAGAAGGGCCCGCCTGGCGGGCG GGGGGAGGCGGGGCCGCCCGAGC CCAACCGAGTCCGACCAGGTGCC CCCTCTGCTCGGCCTAGACCTGA GCTCATTAGGCGGCAGCGGACAG GCCAAGTAGAACACGCGAAGCGC TGGGCTGCCTGCTGCGACCAGGG 62
  • 63. Ordered Data Spatio-Temporal Data Average Monthly Temperature of land and ocean 63
  • 64. 64
  • 67. 67
  • 71. Bagaimanakah pola data ??? Mengumpul Konstan Stasioner Kovergen Mempunyai tren Seragam (uniformity) Koheren Stereotype Jelas (distinct) ... Menyebar Berfluktuasi Non-stasioner Divergen Acak Beragam (diversity) Kacau Anomali Tak jelas (fuzzy) ... 71
  • 73. 73
  • 74. Data Science Data Science adalah disiplin ilmu interdisipliner yang menggunakan metode ilmiah, algoritma, proses saintifik, dan pendekatan sistem untuk mengekstrak knowledge dan insight dari data yang terstruktur atau tidak terstruktur, terorganisasi atau tercampur-baur, serta menerapkan knowledge dan insight berbasis data di berbagai domain. Data Science membutuhkan pengetahuan dan keterampilan: Matematika dan statistika Ilmu komputer dan informatika Domain knowledge (pengetahuan terhadap domain baik dari keilmuan maupun praktik aplikasi) 74
  • 75. 75
  • 76. 76
  • 77. 77
  • 78. 78
  • 79. 79
  • 80. 80
  • 81. 81
  • 82. Data Science Data science memadukan banyak bidang ilmu, mencakup statistika, metode ilmiah, kecerdasan buatan (artificial intelligence, AI), dan analisa data untuk mengekstraksi nilai informasi dari data. https://www.oracle.com/data-science/what-is-data-science/ Data science memadukan metode ilmiah, matematika dan statistika, pemrograman, analisa data, kecerdasan buatan (artificial intelligence, AI), dan storytelling untuk mengungkap dan menjelaskan business insights yang tersembunyi di data. https://www.ibm.com/cloud/learn/data-science-introduction 82
  • 83. 83
  • 84. 84 KDD: Knowledge Discovery and Data Mining AI: Artificial Intelligence
  • 85. Data Science Data Science berkaitan dengan ekstraksi, preparasi, analisis, visualisasi dan maintain informasi. Merupakan disiplin ilmu lintas disipliner yang menggunakan metode ilmiah dan proses saintifik untuk menarik insights dari data. Data Science berkepentingan dengan pengolahan, analisis dan ekstraksi data untuk menghasilkan insights dari data menggunakan berbagai metode statistika dan algoritma komputer. Merupakan disiplin ilmu multidisipliner yang memadukan matematika, statistika dan ilmu komputer. https://data-flair.training/blogs/what-is-data-science/ 85
  • 86. 86
  • 87. 87
  • 88. 88
  • 89. 89
  • 90. 90
  • 91. 91
  • 92. 92
  • 93. 93
  • 94. 94
  • 95. 95
  • 96. 96
  • 97. 97
  • 98. 98
  • 99. 99
  • 100. 100
  • 101. Data Science-Data Analysis What is Data Science? Data Science adalah disiplin ilmu multidisipliner yang memadukan banyak disiplin ilmu berkaitan dengan data dan mengaplikasikan tool dan metode interdisipliner untuk ekstraksi, preparasi, analisis, visualisasi dan maintain data terstruktur atau tak terstruktur untuk menghasilkan knowledge dan insight dari data. What is Data Analysis? Data analysis adalah bagian dari Data Science yang berkaitan dengan pemilihan dan pengaplikasian tool dan metode analisis yang tepat untuk menghasilkan knowledge dan insight dari data. 101
  • 102. Data Science-Data Analysis What is Data Analytics? Data Analytics adalah bagian dari Data Analysis yang menggunakan query dan metode agregasi data untuk memetakan berbagai pola relasi dan dependensi antar variabel input. What is Data Mining? Data Mining adalah metode yang dipergunakan dalam Data Analytics yang memberdayakan kemampuan prediksi dari machine learning dengan mengaplikasikan berbagai algoritma machine learning atas big data untuk mengidentifikasikan pola kecenderungan dari data. 102
  • 103. 103
  • 104. 104
  • 107. 107
  • 108. 108
  • 109. 109
  • 110. 110
  • 111. 111
  • 112. 112
  • 113. 113
  • 114. 114
  • 115. 115
  • 116. 116
  • 117. Artificial Intelligence-Machine Learning What is Artificial Intelligence? Artifial Intelligence adalah teknik dalam disiplin ilmu komputer yang memungkinkan komputer menirukan kecerdasan manusia, menggunakan logika, aturan if-then, pohon keputusan, dan model keputusan lainnya, termasuk machine learning. What is Machine Learning? Machine Learning adalah bagian dari Artificial Intelligence yang melibatkan teknik statistika probabilistik sehingga memungkinkan mesin untuk meningkatkan kemampuan algoritma komputer menjalankan tugas dengan pengalaman. What is Deep Learning? Deep Learning adalah bagian dari Machine Learning yang memadukan algoritma yang memungkinkan software untuk melatih mandiri hingga mampu menjalankan tugas dengan menerapkan multilayered neural network pada data skala besar. 117
  • 118. 118 Terima kasih ... ... Ada pertanyaan ???