SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx

•Download as PPTX, PDF•

0 likes•3 views

Penelitian ini membandingkan kinerja klaster Hadoop private cloud dan klaster Hadoop fisik dalam menyelesaikan komputasi MapReduce untuk skyline query pada big data. Hasilnya menunjukkan bahwa klaster Hadoop private cloud mampu menyelesaikan komputasi tersebut lebih cepat dibandingkan klaster Hadoop fisik karena fleksibilitas dan skalabilitas yang disediakan cloud computing.

Data & Analytics

Performa Klaster Hadoop
MapReduce Pada Private
Cloud Computing untuk
Komputasi Skyline Query
Big Data
Annisa Octavyanti Hakim

Outline Pembahasan
Latar Belakang
Kesimpulan
Metodelogi Penelitian
Hasil
Penjelasan singkat
masalah penelitian
dan rumusan
masalah
Kesimpulan hasil
penelitian secara
keseluruhan
Penyampaian alur
dan metodologi
pengujian sistem
Penyampaian hasil
dan analisa hasil
penelitian
02
03
04
01

Tantangan Implementasi Hadoop
Diperlukan biaya investasi awal yang tidak sedikit.
● Infrastruktur
● Operasional
● Pakar TI
● Pemeliharaan berkelanjutan
Hal ini membuat implementasi Hadoop dengan
physical machine terbatas dilakukan.

Cloud Computing
Cloud computing menawarkan konsep pengolahan sumber
daya komputasi melalui jaringan internet (cloud) dengan
biaya sebesar yang digunakan pengguna saja. Layanan
IaaS:
• Server
• Storage
• Software
• Network
Infrastructure as a Service (IaaS) berbentuk virtual machine
yang bisa di-request sesuai kebutuhan internal.

Fokus Penelitian
Memanfaatkan cluster virtual private
cloud yang dibangun pada server
Universitas Mataram untuk diteliti
kinerjanya dalam menyelesaikan
komputasi Hadoop MapReduce.
Kemudian membandingkan hasil
pengujian performanya pada klaster
Hadoop yang dibangun menggunakan
infrastruktur fisik. Dalam menguji
performance, digunakan beberapa
skenario pengujian.
MR-BNL
Skyline Query
Varian skyline query yang
menggunakan konsep perulan
-gan dalam membaca suatu
record.

Metode Pengujian
Komputasi MapReduce menggunakan
algoritma MR-BNL untuk mencari lokal dan
global Skyline pada data berukuran besar.
Penambahan Jumlah
Node
Penambahan jumlah node pada cluster
bervariatif mulai dari 1 hingga 7 node.
Modifikasi ukuran file
Eksekusi ukuran file mulai dari 100 MB,
200MB, 350 MB, 512 MB, 800 MB hingga 1
GB.
Modifikasi ukuran
block data input
Penambahan block data dengan ukuran
bervariasi mulai dari ukuran default 64 MB,
128 MB, 256 MB dan 512 MB.
Komputasi MR-BNL
Skyline Query

Performa
Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik
Menggunakan data berjumlah 1.5 juta atau 100 MB
pada ketiga data sintetis, klaster private cloud
memproses data anti-correlated (55%), independent
(31%) dan correlated (46%) lebih cepat dibandingkan
klaster Hadoop fisik.
Skenario Variasi Jumlah Data
02

Performa
Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik
Saat mengeksekusi aplikasi Skyline MR-BNL pada data
anti-correlated, correlated dan independent menggunakan
1 mesin, waktu komputasi dengan klaster Hadoop private
cloud unggul dibanding klaster Hadoop fisik masing-
masing sebesar 36%, 35% dan 36%.
Skenario Variasi Jumlah Mesin
02

Performa
Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik
Misalnya, menggunakan block size 64 MB pada ketiga
dataset berukuran 1.06 GB akan menghasilkan potongan
block sebanyak 17 block. Waktu komputasi yang
diperlukan oleh klaster private cloud pada data anti-
correlated, independent dan correlated lebih rendah
dibanding klaster Hadoop fisik dengan persentase
masing-masing sebesar 26%, 18% dan 23%.
Skenario Variasi Ukuran Block HDFS
02

Performa
Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik
02
Hasil T- Test
Klaster Hadoop private cloud yang dibangun bekerja lebih baik dalam menjalankan komputasi Hadoop MapReduce,
dibandingkan klaster mesin fisik (tanpa virtualisasi)

Kesimpulan
• Hadoop MapReduce diimplementasikan
melalui proses instalasi dan konfigurasi
dilakukan lingkungan tempat daemon
Hadoop.
• Penambahan jumlah mesin dari 1 mesin
menjadi 7 mesin meningkatkan kinerja klaster
Hadoop private cloud, sementara bagi klaster
Hadoop fisik menyebabkan overhead.
• Penambahan volume data yang dieksekusi dari 1.5
juta hingga 12 juta akan menyebabkan kenaikan
waktu komputasi dan penurunan kinerja klaster.
01 02
03
03
• Block Size menentukan jumlah potongan block
yang akan dieksekusi dan mempengaruhi
kecepatan komputasi Hadoop MapReduce.
04
• Klaster Hadoop Private Cloud bekerja jauh
lebih baik dalam mengeksekusi aplikasi
Skyline dibandingkan klaster Hadoop Fisik.
05

Similar to SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx

Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...Lippo Group Digital

materi 5 Cloud Computing.docxMAKARIUSGAUR

jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdfIhsanAzhary1

05 pzt web programming jdbc hibernate. kelompok 7pinnsyl

A z cloud databaserizky rivaldi

Pemrosesan paralel untuk kompresi dataEmus Kelen

Chapter 5 - Komputasi Awan.pptxTirtana M. Siregar ST.P, MT.

Jenis Layanan Cloud Computing.pptxAslamBahris

CUDA with DCT AlgorithmAndika Januarianto

Database For Software Development TrendLogistyo Yulistianto

Mari mengenal komputasi awanAbas Djumadi

Tugas 3 Pengantar Komputasi ModernAjeng Jan

Widyatama.lecture.applied networking.iv-week-10.iptvDjadja Sardjana

Nordrassil project web pembangkit ddl dan kode sumber aplikasi basis dataTri Y. Evelina

Widyatama.lecture.applied networking.iv-week-11-cloud.computingDjadja Sardjana

Choirul aspnetdbPram Monty

Kelompok 8 - Cloud DatabaseDejiko Chaem

komputasi-awan.pptssusere8ab1c

pengenalan tentang ilmu komputasi paralel.pdfEvosUglybastarrd

Cloud computingMochamadTriyono

Similar to SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx (20)

Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...

materi 5 Cloud Computing.docx

jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf

05 pzt web programming jdbc hibernate. kelompok 7

A z cloud database

Pemrosesan paralel untuk kompresi data

Chapter 5 - Komputasi Awan.pptx

Jenis Layanan Cloud Computing.pptx

CUDA with DCT Algorithm

Database For Software Development Trend

Mari mengenal komputasi awan

Tugas 3 Pengantar Komputasi Modern

Widyatama.lecture.applied networking.iv-week-10.iptv

Nordrassil project web pembangkit ddl dan kode sumber aplikasi basis data

Widyatama.lecture.applied networking.iv-week-11-cloud.computing

Choirul aspnetdb

Kelompok 8 - Cloud Database

komputasi-awan.ppt

pengenalan tentang ilmu komputasi paralel.pdf

Cloud computing

Recently uploaded

SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehBISMIAULIA

MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxrikosyahputra0173

PPT Olah Nilai Kurikulum merdeka belajar.pptxnursariheldaseptiana

MARIA NOVILIA BOISALA FASILITATOR PMM.pptxmariaboisala21

Metode penelitian Deskriptif atau Surveikustiyantidew94

415418921-statistika- mean media modus data tunggal dan data kelompokelmalinda2

pertemuan-3-distribusi pada-frekuensi.pptAhmadSyajili

kesalahan tipe 1 dan 2 pada statistik.pptxAhmadSyajili

Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiCristianoRonaldo185977

Recently uploaded (9)

SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh

MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx

PPT Olah Nilai Kurikulum merdeka belajar.pptx

MARIA NOVILIA BOISALA FASILITATOR PMM.pptx

Metode penelitian Deskriptif atau Survei

415418921-statistika- mean media modus data tunggal dan data kelompok

pertemuan-3-distribusi pada-frekuensi.ppt

kesalahan tipe 1 dan 2 pada statistik.pptx

Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi

SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx

1. Performa Klaster Hadoop MapReduce Pada Private Cloud Computing untuk Komputasi Skyline Query Big Data Annisa Octavyanti Hakim

2. Outline Pembahasan Latar Belakang Kesimpulan Metodelogi Penelitian Hasil Penjelasan singkat masalah penelitian dan rumusan masalah Kesimpulan hasil penelitian secara keseluruhan Penyampaian alur dan metodologi pengujian sistem Penyampaian hasil dan analisa hasil penelitian 02 03 04 01

3. Tantangan Implementasi Hadoop Diperlukan biaya investasi awal yang tidak sedikit. ● Infrastruktur ● Operasional ● Pakar TI ● Pemeliharaan berkelanjutan Hal ini membuat implementasi Hadoop dengan physical machine terbatas dilakukan.

4. Cloud Computing Cloud computing menawarkan konsep pengolahan sumber daya komputasi melalui jaringan internet (cloud) dengan biaya sebesar yang digunakan pengguna saja. Layanan IaaS: • Server • Storage • Software • Network Infrastructure as a Service (IaaS) berbentuk virtual machine yang bisa di-request sesuai kebutuhan internal.

5. Fokus Penelitian Memanfaatkan cluster virtual private cloud yang dibangun pada server Universitas Mataram untuk diteliti kinerjanya dalam menyelesaikan komputasi Hadoop MapReduce. Kemudian membandingkan hasil pengujian performanya pada klaster Hadoop yang dibangun menggunakan infrastruktur fisik. Dalam menguji performance, digunakan beberapa skenario pengujian. MR-BNL Skyline Query Varian skyline query yang menggunakan konsep perulan -gan dalam membaca suatu record.

6. Metode Pengujian Komputasi MapReduce menggunakan algoritma MR-BNL untuk mencari lokal dan global Skyline pada data berukuran besar. Penambahan Jumlah Node Penambahan jumlah node pada cluster bervariatif mulai dari 1 hingga 7 node. Modifikasi ukuran file Eksekusi ukuran file mulai dari 100 MB, 200MB, 350 MB, 512 MB, 800 MB hingga 1 GB. Modifikasi ukuran block data input Penambahan block data dengan ukuran bervariasi mulai dari ukuran default 64 MB, 128 MB, 256 MB dan 512 MB. Komputasi MR-BNL Skyline Query

7. Performa Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik Menggunakan data berjumlah 1.5 juta atau 100 MB pada ketiga data sintetis, klaster private cloud memproses data anti-correlated (55%), independent (31%) dan correlated (46%) lebih cepat dibandingkan klaster Hadoop fisik. Skenario Variasi Jumlah Data 02

8. Performa Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik Saat mengeksekusi aplikasi Skyline MR-BNL pada data anti-correlated, correlated dan independent menggunakan 1 mesin, waktu komputasi dengan klaster Hadoop private cloud unggul dibanding klaster Hadoop fisik masing- masing sebesar 36%, 35% dan 36%. Skenario Variasi Jumlah Mesin 02

9. Performa Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik Misalnya, menggunakan block size 64 MB pada ketiga dataset berukuran 1.06 GB akan menghasilkan potongan block sebanyak 17 block. Waktu komputasi yang diperlukan oleh klaster private cloud pada data anti- correlated, independent dan correlated lebih rendah dibanding klaster Hadoop fisik dengan persentase masing-masing sebesar 26%, 18% dan 23%. Skenario Variasi Ukuran Block HDFS 02

10. Performa Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik 02 Hasil T- Test Klaster Hadoop private cloud yang dibangun bekerja lebih baik dalam menjalankan komputasi Hadoop MapReduce, dibandingkan klaster mesin fisik (tanpa virtualisasi)

11. Kesimpulan • Hadoop MapReduce diimplementasikan melalui proses instalasi dan konfigurasi dilakukan lingkungan tempat daemon Hadoop. • Penambahan jumlah mesin dari 1 mesin menjadi 7 mesin meningkatkan kinerja klaster Hadoop private cloud, sementara bagi klaster Hadoop fisik menyebabkan overhead. • Penambahan volume data yang dieksekusi dari 1.5 juta hingga 12 juta akan menyebabkan kenaikan waktu komputasi dan penurunan kinerja klaster. 01 02 03 03 • Block Size menentukan jumlah potongan block yang akan dieksekusi dan mempengaruhi kecepatan komputasi Hadoop MapReduce. 04 • Klaster Hadoop Private Cloud bekerja jauh lebih baik dalam mengeksekusi aplikasi Skyline dibandingkan klaster Hadoop Fisik. 05

Editor's Notes

Hadoop merupakan suatu framework popular yang digunakan untuk mengolah data bervolume besar menggunakan konsep distribusi paralel melalui suatu cluster. Mengelola big data menggunakan Hadoop memiliki tantangan tersendiri dalam menyediakan, setting dan maintenance infrastruktur skala besar yang kompleks seperti Hadoop. Untuk menangani permasalahan ini, dibutuhkan teknologii cloud computing.
Maka dari itu, cloud computing menawarkan penyediaan sumber daya komputasi berupa server, storage, software dan network. Cloud computing setara dengan komputer dan sistem operasi kita. Sejumlah besar sumber daya perangkat keras divirtualisasi (penyimpanan, RAM, disk space, sistem operasi, network dan kekuatan pemrosesan CPU) dan kemudian dialokasikan dan digunakan. Inti dari cloud computing adalah memberikan kekuatan komputasi kepada pengguna sebagai layanan kecil dengan menggunakan dan membayar sesuai permintaan pengguna saja.
Pada penelitian saya, objek yang diteliti terletak pada analisa kinerja atau performa cluster virtual private cloud yang dibangun pada server Universitas Mataram untuk komputasi Hadoop Mapreduce menggunakan beberapa skenario pengujian. Salah satunya ialah MR-BNL Skyline Query atau Block Nested Loops. Skyline Query merupakan metode pencarian sekumpulan objek penting yang memiliki kriteria lebih baik dari pada objek lainnya dalam himpunan data. Algoritma ini dipilih karena kompleksitas algoritma ini sangat bergantung pada jumlah dimensi dan besar dataset yang digunakan.
- Pada pengujian kedua, jumlah node aktif yang digunakan akan ditambah untuk mengamati respon cluster dalam mengerjakan suatu task. Penambahan jumlah node pada cluster bervariatif mulai dari1hingga 7 node. - Skenario modifikasi ukuran file dilakukan secara bertahap untuk menguji kecepatan waktu eksekusi cluster terhadap data seiring penambahan ukuran file - Skenario penambahan block akan menguji apakah ukuran data yang di-split dapat berdampak pada waktu eksekusi. Selain itu, skenario ini akan membantu memprediksi perilaku cluster dalam menanggapi input data dengan ukuran block yang berbeda.
Pengaruh penambahan jumlah data secara garis besar mampu menurunkan kinerja klaster. Secara keseluruhan, pengaruh jumlah data terhadap waktu komputasi Hadoop MapReduce menunjukkan semakin besar data yang diproses, semakin lama pula waktu eksekusinya.
Private cloud : Secara umum, waktu menyelesaikan komputasi Hadoop MapReduce bertambah secara signifikan ketika mesin diskalakan. Ini juga menunjukkan percepatan yang ideal, dimana peningkatan kecepatan komputasi terjadi seiring penambahan jumlah prosessor. Fisik : Secara garis besar, klaster menunjukkan kinerja yang tidak optimal ketika menjalankan ketiga dataset menggunakan 7 node. Adanya peningkatan waktu komputasi ini diduga dipicu oleh kompleksitas pada proses distribusi data, sinkronisasi antar node dan komunikasi antar daemon Hadoop ketika jumlah mesin ditambah serta network bottleneck.
Perbesaran ukuran block akan memperkecil jumlah block yang akan dieksekusi. Banyaknya potongan block yang akan diproses membuat kinerja namenode dan MapReduce menjadi lebih lambat. Hal ini akan membuat kinerja klaster terhambat dan waktu komputasi menjadi lebih lama. Berdasarkan pengujian yang dilakukan, block berukuran 64 MB tidak cocok digunakan untuk file berukuran 1.06 GB. Sementara itu, waktu komputasi tercepat ditunjukkan ketika block size 512 MB dengan jumlah block yang dihasilkan hanya 3 block
Berdasarkan hasil uji statistik t pada Gambar 4.48, Gambar 4.50, Gambar 4.52, dapat dibuktikan bahwa dalam menjalankan keseluruhan pengujian mulai dari perubahan ukuran file, perubahan jumlah mesin dan modifikasi blocksize HDFS, dengan spesifikasi tertentu, klaster Hadoop private cloud yang dibangun bekerja lebih baik dalam menjalankan komputasi Hadoop MapReduce, dibandingkan klaster mesin fisik (tanpa virtualisasi).

SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx

Recommended

Recommended

More Related Content

Similar to SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx

Similar to SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx (20)

Recently uploaded

Recently uploaded (9)

SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx

Editor's Notes