SlideShare a Scribd company logo
1 of 11
Performa Klaster Hadoop
MapReduce Pada Private
Cloud Computing untuk
Komputasi Skyline Query
Big Data
Annisa Octavyanti Hakim
Outline Pembahasan
Latar Belakang
Kesimpulan
Metodelogi Penelitian
Hasil
Penjelasan singkat
masalah penelitian
dan rumusan
masalah
Kesimpulan hasil
penelitian secara
keseluruhan
Penyampaian alur
dan metodologi
pengujian sistem
Penyampaian hasil
dan analisa hasil
penelitian
02
03
04
01
Tantangan Implementasi Hadoop
Diperlukan biaya investasi awal yang tidak sedikit.
● Infrastruktur
● Operasional
● Pakar TI
● Pemeliharaan berkelanjutan
Hal ini membuat implementasi Hadoop dengan
physical machine terbatas dilakukan.
Cloud Computing
Cloud computing menawarkan konsep pengolahan sumber
daya komputasi melalui jaringan internet (cloud) dengan
biaya sebesar yang digunakan pengguna saja. Layanan
IaaS:
• Server
• Storage
• Software
• Network
Infrastructure as a Service (IaaS) berbentuk virtual machine
yang bisa di-request sesuai kebutuhan internal.
Fokus Penelitian
Memanfaatkan cluster virtual private
cloud yang dibangun pada server
Universitas Mataram untuk diteliti
kinerjanya dalam menyelesaikan
komputasi Hadoop MapReduce.
Kemudian membandingkan hasil
pengujian performanya pada klaster
Hadoop yang dibangun menggunakan
infrastruktur fisik. Dalam menguji
performance, digunakan beberapa
skenario pengujian.
MR-BNL
Skyline Query
Varian skyline query yang
menggunakan konsep perulan
-gan dalam membaca suatu
record.
Metode Pengujian
Komputasi MapReduce menggunakan
algoritma MR-BNL untuk mencari lokal dan
global Skyline pada data berukuran besar.
Penambahan Jumlah
Node
Penambahan jumlah node pada cluster
bervariatif mulai dari 1 hingga 7 node.
Modifikasi ukuran file
Eksekusi ukuran file mulai dari 100 MB,
200MB, 350 MB, 512 MB, 800 MB hingga 1
GB.
Modifikasi ukuran
block data input
Penambahan block data dengan ukuran
bervariasi mulai dari ukuran default 64 MB,
128 MB, 256 MB dan 512 MB.
Komputasi MR-BNL
Skyline Query
Performa
Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik
Menggunakan data berjumlah 1.5 juta atau 100 MB
pada ketiga data sintetis, klaster private cloud
memproses data anti-correlated (55%), independent
(31%) dan correlated (46%) lebih cepat dibandingkan
klaster Hadoop fisik.
Skenario Variasi Jumlah Data
02
Performa
Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik
Saat mengeksekusi aplikasi Skyline MR-BNL pada data
anti-correlated, correlated dan independent menggunakan
1 mesin, waktu komputasi dengan klaster Hadoop private
cloud unggul dibanding klaster Hadoop fisik masing-
masing sebesar 36%, 35% dan 36%.
Skenario Variasi Jumlah Mesin
02
Performa
Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik
Misalnya, menggunakan block size 64 MB pada ketiga
dataset berukuran 1.06 GB akan menghasilkan potongan
block sebanyak 17 block. Waktu komputasi yang
diperlukan oleh klaster private cloud pada data anti-
correlated, independent dan correlated lebih rendah
dibanding klaster Hadoop fisik dengan persentase
masing-masing sebesar 26%, 18% dan 23%.
Skenario Variasi Ukuran Block HDFS
02
Performa
Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik
02
Hasil T- Test
Klaster Hadoop private cloud yang dibangun bekerja lebih baik dalam menjalankan komputasi Hadoop MapReduce,
dibandingkan klaster mesin fisik (tanpa virtualisasi)
Kesimpulan
• Hadoop MapReduce diimplementasikan
melalui proses instalasi dan konfigurasi
dilakukan lingkungan tempat daemon
Hadoop.
• Penambahan jumlah mesin dari 1 mesin
menjadi 7 mesin meningkatkan kinerja klaster
Hadoop private cloud, sementara bagi klaster
Hadoop fisik menyebabkan overhead.
• Penambahan volume data yang dieksekusi dari 1.5
juta hingga 12 juta akan menyebabkan kenaikan
waktu komputasi dan penurunan kinerja klaster.
01 02
03
03
• Block Size menentukan jumlah potongan block
yang akan dieksekusi dan mempengaruhi
kecepatan komputasi Hadoop MapReduce.
04
• Klaster Hadoop Private Cloud bekerja jauh
lebih baik dalam mengeksekusi aplikasi
Skyline dibandingkan klaster Hadoop Fisik.
05

More Related Content

Similar to SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx

Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...
Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...
Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...Lippo Group Digital
 
materi 5 Cloud Computing.docx
materi 5 Cloud Computing.docxmateri 5 Cloud Computing.docx
materi 5 Cloud Computing.docxMAKARIUSGAUR
 
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdfjbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdfIhsanAzhary1
 
05 pzt web programming jdbc hibernate. kelompok 7
05 pzt web programming jdbc hibernate. kelompok 705 pzt web programming jdbc hibernate. kelompok 7
05 pzt web programming jdbc hibernate. kelompok 7pinnsyl
 
Pemrosesan paralel untuk kompresi data
Pemrosesan paralel untuk kompresi dataPemrosesan paralel untuk kompresi data
Pemrosesan paralel untuk kompresi dataEmus Kelen
 
Jenis Layanan Cloud Computing.pptx
Jenis Layanan Cloud Computing.pptxJenis Layanan Cloud Computing.pptx
Jenis Layanan Cloud Computing.pptxAslamBahris
 
Database For Software Development Trend
Database For Software Development TrendDatabase For Software Development Trend
Database For Software Development TrendLogistyo Yulistianto
 
Mari mengenal komputasi awan
Mari mengenal komputasi awanMari mengenal komputasi awan
Mari mengenal komputasi awanAbas Djumadi
 
Tugas 3 Pengantar Komputasi Modern
Tugas 3 Pengantar Komputasi ModernTugas 3 Pengantar Komputasi Modern
Tugas 3 Pengantar Komputasi ModernAjeng Jan
 
Widyatama.lecture.applied networking.iv-week-10.iptv
Widyatama.lecture.applied networking.iv-week-10.iptvWidyatama.lecture.applied networking.iv-week-10.iptv
Widyatama.lecture.applied networking.iv-week-10.iptvDjadja Sardjana
 
Nordrassil project web pembangkit ddl dan kode sumber aplikasi basis data
Nordrassil project  web pembangkit ddl dan kode sumber aplikasi basis dataNordrassil project  web pembangkit ddl dan kode sumber aplikasi basis data
Nordrassil project web pembangkit ddl dan kode sumber aplikasi basis dataTri Y. Evelina
 
Widyatama.lecture.applied networking.iv-week-11-cloud.computing
Widyatama.lecture.applied networking.iv-week-11-cloud.computingWidyatama.lecture.applied networking.iv-week-11-cloud.computing
Widyatama.lecture.applied networking.iv-week-11-cloud.computingDjadja Sardjana
 
Choirul aspnetdb
Choirul aspnetdbChoirul aspnetdb
Choirul aspnetdbPram Monty
 
Kelompok 8 - Cloud Database
Kelompok 8 - Cloud DatabaseKelompok 8 - Cloud Database
Kelompok 8 - Cloud DatabaseDejiko Chaem
 
komputasi-awan.ppt
komputasi-awan.pptkomputasi-awan.ppt
komputasi-awan.pptssusere8ab1c
 
pengenalan tentang ilmu komputasi paralel.pdf
pengenalan tentang ilmu komputasi paralel.pdfpengenalan tentang ilmu komputasi paralel.pdf
pengenalan tentang ilmu komputasi paralel.pdfEvosUglybastarrd
 

Similar to SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx (20)

Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...
Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...
Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...
 
materi 5 Cloud Computing.docx
materi 5 Cloud Computing.docxmateri 5 Cloud Computing.docx
materi 5 Cloud Computing.docx
 
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdfjbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
 
05 pzt web programming jdbc hibernate. kelompok 7
05 pzt web programming jdbc hibernate. kelompok 705 pzt web programming jdbc hibernate. kelompok 7
05 pzt web programming jdbc hibernate. kelompok 7
 
A z cloud database
A z cloud databaseA z cloud database
A z cloud database
 
Pemrosesan paralel untuk kompresi data
Pemrosesan paralel untuk kompresi dataPemrosesan paralel untuk kompresi data
Pemrosesan paralel untuk kompresi data
 
Chapter 5 - Komputasi Awan.pptx
Chapter 5 - Komputasi Awan.pptxChapter 5 - Komputasi Awan.pptx
Chapter 5 - Komputasi Awan.pptx
 
Jenis Layanan Cloud Computing.pptx
Jenis Layanan Cloud Computing.pptxJenis Layanan Cloud Computing.pptx
Jenis Layanan Cloud Computing.pptx
 
CUDA with DCT Algorithm
CUDA with DCT AlgorithmCUDA with DCT Algorithm
CUDA with DCT Algorithm
 
Database For Software Development Trend
Database For Software Development TrendDatabase For Software Development Trend
Database For Software Development Trend
 
Mari mengenal komputasi awan
Mari mengenal komputasi awanMari mengenal komputasi awan
Mari mengenal komputasi awan
 
Tugas 3 Pengantar Komputasi Modern
Tugas 3 Pengantar Komputasi ModernTugas 3 Pengantar Komputasi Modern
Tugas 3 Pengantar Komputasi Modern
 
Widyatama.lecture.applied networking.iv-week-10.iptv
Widyatama.lecture.applied networking.iv-week-10.iptvWidyatama.lecture.applied networking.iv-week-10.iptv
Widyatama.lecture.applied networking.iv-week-10.iptv
 
Nordrassil project web pembangkit ddl dan kode sumber aplikasi basis data
Nordrassil project  web pembangkit ddl dan kode sumber aplikasi basis dataNordrassil project  web pembangkit ddl dan kode sumber aplikasi basis data
Nordrassil project web pembangkit ddl dan kode sumber aplikasi basis data
 
Widyatama.lecture.applied networking.iv-week-11-cloud.computing
Widyatama.lecture.applied networking.iv-week-11-cloud.computingWidyatama.lecture.applied networking.iv-week-11-cloud.computing
Widyatama.lecture.applied networking.iv-week-11-cloud.computing
 
Choirul aspnetdb
Choirul aspnetdbChoirul aspnetdb
Choirul aspnetdb
 
Kelompok 8 - Cloud Database
Kelompok 8 - Cloud DatabaseKelompok 8 - Cloud Database
Kelompok 8 - Cloud Database
 
komputasi-awan.ppt
komputasi-awan.pptkomputasi-awan.ppt
komputasi-awan.ppt
 
pengenalan tentang ilmu komputasi paralel.pdf
pengenalan tentang ilmu komputasi paralel.pdfpengenalan tentang ilmu komputasi paralel.pdf
pengenalan tentang ilmu komputasi paralel.pdf
 
Cloud computing
Cloud computingCloud computing
Cloud computing
 

Recently uploaded

SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehSKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehBISMIAULIA
 
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxrikosyahputra0173
 
PPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxPPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxnursariheldaseptiana
 
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxmariaboisala21
 
Metode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau SurveiMetode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau Surveikustiyantidew94
 
415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompokelmalinda2
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptAhmadSyajili
 
kesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxkesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxAhmadSyajili
 
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiCristianoRonaldo185977
 

Recently uploaded (9)

SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehSKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
 
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
 
PPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxPPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptx
 
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
 
Metode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau SurveiMetode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau Survei
 
415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.ppt
 
kesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxkesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptx
 
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
 

SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx

  • 1. Performa Klaster Hadoop MapReduce Pada Private Cloud Computing untuk Komputasi Skyline Query Big Data Annisa Octavyanti Hakim
  • 2. Outline Pembahasan Latar Belakang Kesimpulan Metodelogi Penelitian Hasil Penjelasan singkat masalah penelitian dan rumusan masalah Kesimpulan hasil penelitian secara keseluruhan Penyampaian alur dan metodologi pengujian sistem Penyampaian hasil dan analisa hasil penelitian 02 03 04 01
  • 3. Tantangan Implementasi Hadoop Diperlukan biaya investasi awal yang tidak sedikit. ● Infrastruktur ● Operasional ● Pakar TI ● Pemeliharaan berkelanjutan Hal ini membuat implementasi Hadoop dengan physical machine terbatas dilakukan.
  • 4. Cloud Computing Cloud computing menawarkan konsep pengolahan sumber daya komputasi melalui jaringan internet (cloud) dengan biaya sebesar yang digunakan pengguna saja. Layanan IaaS: • Server • Storage • Software • Network Infrastructure as a Service (IaaS) berbentuk virtual machine yang bisa di-request sesuai kebutuhan internal.
  • 5. Fokus Penelitian Memanfaatkan cluster virtual private cloud yang dibangun pada server Universitas Mataram untuk diteliti kinerjanya dalam menyelesaikan komputasi Hadoop MapReduce. Kemudian membandingkan hasil pengujian performanya pada klaster Hadoop yang dibangun menggunakan infrastruktur fisik. Dalam menguji performance, digunakan beberapa skenario pengujian. MR-BNL Skyline Query Varian skyline query yang menggunakan konsep perulan -gan dalam membaca suatu record.
  • 6. Metode Pengujian Komputasi MapReduce menggunakan algoritma MR-BNL untuk mencari lokal dan global Skyline pada data berukuran besar. Penambahan Jumlah Node Penambahan jumlah node pada cluster bervariatif mulai dari 1 hingga 7 node. Modifikasi ukuran file Eksekusi ukuran file mulai dari 100 MB, 200MB, 350 MB, 512 MB, 800 MB hingga 1 GB. Modifikasi ukuran block data input Penambahan block data dengan ukuran bervariasi mulai dari ukuran default 64 MB, 128 MB, 256 MB dan 512 MB. Komputasi MR-BNL Skyline Query
  • 7. Performa Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik Menggunakan data berjumlah 1.5 juta atau 100 MB pada ketiga data sintetis, klaster private cloud memproses data anti-correlated (55%), independent (31%) dan correlated (46%) lebih cepat dibandingkan klaster Hadoop fisik. Skenario Variasi Jumlah Data 02
  • 8. Performa Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik Saat mengeksekusi aplikasi Skyline MR-BNL pada data anti-correlated, correlated dan independent menggunakan 1 mesin, waktu komputasi dengan klaster Hadoop private cloud unggul dibanding klaster Hadoop fisik masing- masing sebesar 36%, 35% dan 36%. Skenario Variasi Jumlah Mesin 02
  • 9. Performa Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik Misalnya, menggunakan block size 64 MB pada ketiga dataset berukuran 1.06 GB akan menghasilkan potongan block sebanyak 17 block. Waktu komputasi yang diperlukan oleh klaster private cloud pada data anti- correlated, independent dan correlated lebih rendah dibanding klaster Hadoop fisik dengan persentase masing-masing sebesar 26%, 18% dan 23%. Skenario Variasi Ukuran Block HDFS 02
  • 10. Performa Klaster Hadoop Private Cloud dan Klaster Hadoop Fisik 02 Hasil T- Test Klaster Hadoop private cloud yang dibangun bekerja lebih baik dalam menjalankan komputasi Hadoop MapReduce, dibandingkan klaster mesin fisik (tanpa virtualisasi)
  • 11. Kesimpulan • Hadoop MapReduce diimplementasikan melalui proses instalasi dan konfigurasi dilakukan lingkungan tempat daemon Hadoop. • Penambahan jumlah mesin dari 1 mesin menjadi 7 mesin meningkatkan kinerja klaster Hadoop private cloud, sementara bagi klaster Hadoop fisik menyebabkan overhead. • Penambahan volume data yang dieksekusi dari 1.5 juta hingga 12 juta akan menyebabkan kenaikan waktu komputasi dan penurunan kinerja klaster. 01 02 03 03 • Block Size menentukan jumlah potongan block yang akan dieksekusi dan mempengaruhi kecepatan komputasi Hadoop MapReduce. 04 • Klaster Hadoop Private Cloud bekerja jauh lebih baik dalam mengeksekusi aplikasi Skyline dibandingkan klaster Hadoop Fisik. 05

Editor's Notes

  1. Hadoop merupakan suatu framework popular yang digunakan untuk mengolah data bervolume besar menggunakan konsep distribusi paralel melalui suatu cluster.  Mengelola big data menggunakan Hadoop memiliki tantangan tersendiri dalam menyediakan, setting dan maintenance infrastruktur skala besar yang kompleks seperti Hadoop. Untuk menangani permasalahan ini, dibutuhkan teknologii cloud computing.
  2. Maka dari itu, cloud computing menawarkan penyediaan sumber daya komputasi berupa server, storage, software dan network. Cloud computing setara dengan komputer dan sistem operasi kita. Sejumlah besar sumber daya perangkat keras divirtualisasi (penyimpanan, RAM, disk space, sistem operasi, network dan kekuatan pemrosesan CPU) dan kemudian dialokasikan dan digunakan. Inti dari cloud computing adalah memberikan kekuatan komputasi kepada pengguna sebagai layanan kecil dengan menggunakan dan membayar sesuai permintaan pengguna saja.
  3. Pada penelitian saya, objek yang diteliti terletak pada analisa kinerja atau performa cluster virtual private cloud yang dibangun pada server Universitas Mataram untuk komputasi Hadoop Mapreduce menggunakan beberapa skenario pengujian. Salah satunya ialah MR-BNL Skyline Query atau Block Nested Loops. Skyline Query merupakan metode pencarian sekumpulan objek penting yang memiliki kriteria lebih baik dari pada objek lainnya dalam himpunan data. Algoritma ini dipilih karena kompleksitas algoritma ini sangat bergantung pada jumlah dimensi dan besar dataset yang digunakan. 
  4. - Pada pengujian kedua, jumlah node aktif yang digunakan akan ditambah untuk mengamati respon cluster dalam mengerjakan suatu task. Penambahan jumlah node pada cluster bervariatif mulai dari1hingga 7 node.  - Skenario modifikasi ukuran file dilakukan secara bertahap untuk menguji kecepatan waktu eksekusi cluster terhadap data seiring penambahan ukuran file - Skenario penambahan block akan menguji apakah ukuran data yang di-split dapat berdampak pada waktu eksekusi. Selain itu, skenario ini akan membantu memprediksi perilaku cluster dalam menanggapi input data dengan ukuran block yang berbeda. 
  5. Pengaruh penambahan jumlah data secara garis besar mampu menurunkan kinerja klaster. Secara keseluruhan, pengaruh jumlah data terhadap waktu komputasi Hadoop MapReduce menunjukkan semakin besar data yang diproses, semakin lama pula waktu eksekusinya.
  6. Private cloud : Secara umum, waktu menyelesaikan komputasi Hadoop MapReduce bertambah secara signifikan ketika mesin diskalakan. Ini juga menunjukkan percepatan yang ideal, dimana peningkatan kecepatan komputasi terjadi seiring penambahan jumlah prosessor. Fisik : Secara garis besar, klaster menunjukkan kinerja yang tidak optimal ketika menjalankan ketiga dataset menggunakan 7 node. Adanya peningkatan waktu komputasi ini diduga dipicu oleh kompleksitas pada proses distribusi data, sinkronisasi antar node dan komunikasi antar daemon Hadoop ketika jumlah mesin ditambah serta network bottleneck.
  7. Perbesaran ukuran block akan memperkecil jumlah block yang akan dieksekusi. Banyaknya potongan block yang akan diproses membuat kinerja namenode dan MapReduce menjadi lebih lambat. Hal ini akan membuat kinerja klaster terhambat dan waktu komputasi menjadi lebih lama. Berdasarkan pengujian yang dilakukan, block berukuran 64 MB tidak cocok digunakan untuk file berukuran 1.06 GB. Sementara itu, waktu komputasi tercepat ditunjukkan ketika block size 512 MB dengan jumlah block yang dihasilkan hanya 3 block
  8. Berdasarkan hasil uji statistik t pada Gambar 4.48, Gambar 4.50, Gambar 4.52, dapat dibuktikan bahwa dalam menjalankan keseluruhan pengujian mulai dari perubahan ukuran file, perubahan jumlah mesin dan modifikasi blocksize HDFS, dengan spesifikasi tertentu, klaster Hadoop private cloud yang dibangun bekerja lebih baik dalam menjalankan komputasi Hadoop MapReduce, dibandingkan klaster mesin fisik (tanpa virtualisasi).