Aplikasi Smartphone Berbasis Web Crawler dan NoSQL: Contoh Sederhana Implementasi Pemberdayaan Big Data

Big Data hanya akan berupa kumpulan data mentah yang tak berarti apa-apa jika tidak diberdayakan. Namun demikian, pemberdayaan Big Data bukanlah perkara mudah, butuh investasi infrastruktur, sumber daya manusia, serentetan software, dan waktu yang tidak sedikit. Konsekuensinya, implementasi Big Data jadi terkesan jauh dari jangkauan individu maupun organisasi yang tak memiliki sumber daya berlimpah. Oleh karena itu, pada kesempatan ini, akan disajikan contoh sederhana pemberdayaan Big Data yang dapat diimplementasikan dengan kebutuhan sumber daya yang relatif kecil baik itu yang menyangkut infrastruktur maupun software.

Berbicara tentang penyediaan infrastruktur dan software, paling tidak ada 4 hal yg harus dipertimbangkan, yakni: data collection, data storage, data analysis, data visualization (output). Hasil (output) yang ingin dicapai adalah hal pertama yang mesti ditentukan karena ini lah yang menjadi tujuan dari pemberdayaan Big Data itu sendiri. Pada contoh kali ini, tujuan dari pemberdayaan Big Data adalah untuk mendapatkan informasi produk-produk yang sedang dijual dengan harga diskon/promo dari peritel-peritel nasional seperti Alfamart, Carrefour, Giant, Guardian, Hari Hari, Hypermart, Indomaret, Lottemart, Superindo, Tip Top, Watsons, dan Yogya. Informasi tersebut akan ditampilkan berdasarkan kategori produk, nama peritel, dan area berlakunya harga promo tersebut. Selain itu, juga dimuat masa berlaku dari tiap promo tersebut.

Setelah tujuan ditentukan, kita telah siap untuk membangun infrastruktur maupun software yang dibutuhkan dengan mempertimbangkan 4 hal tadi (Data Collection, Data Storage, Data Analytics, dan Data Visualization).


Data Collection

Data collection menyangkut data apa yg perlu dikumpulkan untuk mencapai tujuan pemberdayaan Big Data yang telah ditentukan. Pada contoh kali ini, sumber data yang digunakan adalah web pages. Oleh karena itu, kita akan membangun web crawler untuk mengumpulkan data-data produk promo dari peritel-peritel nasional yang telah disebutkan. Ada banyak crawler yang bisa digunakan untuk tujuan ini, seperti Apache Nutch, Scrapy dan sebagainya.


Data Storage

Data Storage berkaitan dengan penyimpanan data-data yang telah didapatkan pada Data Collection. Pada contoh ini, data hasil crawling akan disimpan dalam database NoSQL, seperti MongoDB, HBase dan sebagainya.


Data Analytics

Data Analytics adalah metode-metode yang akan ditempuh untuk memproses data-data yang telah disimpan pada Data Storage untuk mendapatkan suatu hasil/output yang diinginkan. Big Data analytics bisa menggunakan platform dari Cloudera, Hortonworks, IBM, AWS maupun dengan platform yang dikembangkan sendiri. Pada contoh sederhana kali ini, sebagai data analytics, hanya digunakan program sederhana yang dikembangkan sendiri untuk memproses data-data hasil crawling menjadi informasi yang diinginkan (sesuai tujuan pemberdayaan Big Data yang telah ditentukan sebelumnya).


Data Visualization

Data Visualization menyangkut bagaimana informasi hasil analytics akan dipresentasikan kepada pengguna hingga mudah dimengerti/dicerna. Pengguna dalam hal ini bisa customer, user, maupun decision maker. Big Data visualization bisa menggunakan tools seperti Google Chart, Tableu, atau bisa didesain sendiri sesuai kebutuhan. Pada contoh sederhana kali ini, informasi hasil analytics yang berupa produk-produk promo yang sudah dikelompokkan berdasarkan jenis produk, nama peritel yang menjual, dan area berlakunya promo, akan divisualkan dalam bentuk mobile application untuk platform iOS maupun Android. Dengan demikian informasi hasil analytics tersebut dapat menjangkau jutaan pengguna smartphone. Namun demikian, agar informasi yang ditampilkan dapat di-update setiap saat, maka diperlukan server database yang dapat diakses oleh aplikasi mobile yang diinstal di tiap smartphone pengguna. Dalam hal ini, kita dapat menggunakan cloud database seperti Google Firebase ataupun Microsoft Azure. Berikut adalah tampilan aplikasi mobile yang menyuguhkan informasi hasil analisa. Aplikasi ini diberi nama InfoPromo, dapat di-download langsung dari iPhone App Store maupun Android Play Store.






Demikian, sebuah contoh sederhana implementasi pemberdayaan Big Data dengan memanfaatkan data-data yang tersedia di Internet. Contoh ini diharapkan dapat memberikan gambaran nyata tentang bagaimana Big Data itu diberdayakan. Untuk contoh yang lebih kompleks, akan dibahas pada artikel-artikel berikutnya.

Comments

satriyojati said…
Hallo mas Wijaya, saya menemukan tulisan mas Wijaya di Kompasiana (https://www[dot]kompasiana[dot]com/wmwijaya/apa-itu-big-data-menyimak-kembali-definisi-big-data-jenis-teknologi-big-data-dan-manfaat-pemberdayaan-big-data_56a38803a423bd831546e6e3) mengenai Big Data.

Saya meminta ijin kepada mas Wijaya untuk memuat tulisan mas ke dalam blog saya yang akan saya sertakan juga sumber dan penulisnya.

Apakah mas Wijaya berkenan?
Vijjam Wjaya said…
Silakan mas, tidak masalah. Silakan dicantumkan sumbernya / link back ke blog ini saja, trima kasih.
Unknown said…
Open source-kah,mas?
Vijjam Wjaya said…
Belum mas. Mau saya open-source-kan tapi struktur website target scraping (sumber data) berubah mas, jadi mesti coding ulang spidernya dulu.

Popular posts from this blog

Apa itu Big Data : Menyimak Kembali Definisi Big Data, Jenis Teknologi Big Data, dan Manfaat Pemberdayaan Big Data

Tutorial Python: Cara Mudah Web Scraping menggunakan Beautiful Soup

MapReduce: Besar dan Powerful, tapi Tidak Ribet

HBase: Hyper NoSQL Database

Cara Sederhana Install Hadoop 2 mode Standalone pada Windows 7 dan Windows 10

Apache Spark: Perangkat Lunak Analisis Terpadu untuk Big Data

Aplikasi iPhone : RETaS Read English Tanpa Kamus!

HDFS: Berawal dari Google untuk Big Data

Big Data dan Rahasia Kejayaan Google

Validitas Rapid Test Covid 19 : Accuracy vs F1-Score, Pilih yang Mana?