Amazon Web Services (AWS) : Langkah-langkah Membuat dan Konfigurasi Kluster Amazon Elastic MapReduce (EMR)

April 28, 2020

Pada laman Amazon Web Services (AWS) , login ke AWS Management Console kemudian pilih service Amazon Elasctic MapReduce (EMR).

Selanjutnya, ikuti langkah-langkah berikut:

Pada laman Amazon EMR klik button Create Cluster.
Isi kolom nama cluster (contoh : My Cluster) dan aktifkan Logging
Isi parameter-parameter berikut untuk mengkonfigurasi kluster :

Pilih Launch Mode : Cluster
Release : pilih release terbaru (saat artikel ini dibuat, versi terbaru adalah emr-6.0.0
Application : Spark: Spark 2.4.4 on Hadoop 3.2.1 YARN with Ganglia 3.7.2 and Zeppelin 0.9.0-SNAPSHOT
Instance Type : m5.xlarge (atau pilih sesuai kebutuhan)
Number of Instances : 3 (1 master dan 2 core nodes)
EC2 key pair : pilih nama EC2 key pair yang telah dibuat sebelumnya (jika belum buat, silakan ikuti langkah-langkah pembuatan EC2 key pair di artikel ini : )
Permission : Default
EMR role : EMR_DefaultRole
EC2 instance profile : EMR_EC2_DefaultRole
Cek kembali konfigurasi yang telah dibuat. Jika sudah yakin benar, klik button Create Cluster.
Kluster akan ditampilkan dengan status Starting (pada tahap ini kluster akan melalui proses validasi yang memakan waktu maksimal 2 jam)
Setelah validasi selesai dan sukses, status kluster akan menjadi Waiting (sampai disini, kluster telah sukses dibuat dan dikonfigurasi, dan seharusnya sudah siap pakai)

Cukup mudah bukan, jauh lebih mudah daripada membuat kluster lokal dengan komputer/server sendiri.

Selanjutnya, mari kita coba mengakses Master node pada kluster yang telah dibuat dengan menggunakan Secure Shell (SSH).
Langkah-langkahnya ada di artikel : Cara Koneksi SSH (Secure Shell) ke Amazon Elastic MapReduce (EMR) dari OS Linux dan MacOS.

Catatan :

Pada langkah 3.10. , ada kalanya muncul error terkait EMR_EC2_DefaultRole.
Jika error ini muncul, klik sekali lagi button Create Cluster.
Setelah ini, kemungkinan akan muncul error terkait nama bucket S3 sebagai destinasi logging.
Jika error ini muncul, login ke Amazon S3 dan hapus bucket S3 destinasi logging tersebut.
Setelah itu, klik lagi button Create Cluster.

Comments

Julian Hogan said…

Great readding this

June 21, 2023 at 11:33 AM

Search This Blog

Teknologi Big Data