Mengenal Lebih Jauh Lagi Tentang Big Data – Terdapat berbagai macam definisi Big Data, salah satunya menurut Thomas Davenport, seorang akademisi yang dianggap sebagai bapak Big Data, adalah data yang terlalu besar untuk diproses dalam sebuah server, terlalu cepat berubah jika disimpan dalam data warehouse, dan terlalu acak (unstructured) apabila disimpan dalam suatu database (RDBMS).
Menurut perusahaan Oracle, Big Data adalah data yang mengandung berbagai macam tipe (Variety), berjumlah sangat besar (Volume), dan bergerak cepat (Velocity), dan dengan adanya 3V tersebut, pelaku bisnis dapat menjawab permasalahan bisnisnya dengan Data Analytics.
Dari kedua penjelasan Big Data di atas, terdapat beberapa kesamaan dasar tumbuhnya Big Data yaitu, pertama, pertumbuhan data yang semakin pesat dan ukuran penyimpanan data yang semakin meningkat, kedua, pemrosesan structured dan unstructured data, serta terakhir aliran pemrosesan data.
Pertumbuhan dan Penyimpanan Data
Pertumbuhan dan penyimpanan data berkembang secara pesat sejak kita memasuki zaman digital. Dimulai dari perkembangan analog storage seperti tape atau film, menuju digital storage seperti harddisk, flash drive, atau bluray, pertumbuhan dan penyimpanan data meningkat berbanding lurus antara keduanya.

Pada pertumbuhan data, kita dapat melihat sendiri perkembangan kualitas data dan semakin banyaknya sumber data. Sebagai contoh, digital movie yang sebelumnya menggunakan resolusi Video Graphics Array (VGA) dengan ukuran lebar 640 pixel dan tinggi 480 pixel, sekarang pada umumnya menggunakan resolusi 4K High Definition dengan ukuran lebar 3840 pixel dan tinggi 2160 pixel.
Contoh lain adalah dengan adanya Internet of Things, semakin besar data yang dikumpulkan seperti contoh Fitness Band yang selalu menyimpan data-data saat kita sedang beraktivitas maupun tertidur dan sensor-sensor yang selalu menyimpan perubahan data untuk dilakukan analisis kemudian.
Pada penyimpanan data, kita juga menyaksikan perkembangan media penyimpanan data yang semakin besar kapasitasnya dan semakin cepat performanya. Sebagai contoh pada gambar 2, storage server dengan ukuran yang sama pada tahun 1991 mempunyai kapasitas 2 GB, dan pada tahun 2013 mempunyai kapasitas 720 TB. Contoh yang lain yaitu throughput sebuah harddisk pada tahun 1991 yaitu 9.

Dengan pertumbuhan data yang semakin cepat dan penyimpanan data yang semakin besar, maka diperlukan suatu teknologi yang dapat menggunakan data tersebut untuk memberikan solusi permasalahan bisnis yang dihadapi, yaitu Big Data.
Structured dan Unstructured Data
Fungsi utama dari Sistem Informasi adalah melakukan manajemen informasi berupa data terstruktur dan tidak terstruktur. Structured data adalah kumpulan informasi yang memiliki kamus data tetap dalam sebuah rekaman basis data. Kumpulan informasi tersebut ditampung dalam sebuah Relational Database Management System (RDBMS). Sebagai contoh yaitu data cuti pegawai dalam sebuah tabel Cuti Pegawai pada basis data Sistem Kepegawaian menggunakan RDBMS SQL Server.
Sedangkan unstructured data adalah kebalikannya, yaitu kumpulan informasi yang tidak memiliki data model dan tidak terorganisir sehingga sulit untuk dimengerti oleh bahasa pemrograman pada umumnya. Sebagai contoh adalah informasi yang tersimpan pada dokumen pdf, word, maupun video dan audio.
Pada tahun 1998, Merrill Lynch, sebuah perusahaan investasi ternama di negara Amerika Serikat mengatakan bahwa 80-90% informasi bisnis yang berpotensi untuk digunakan mendapatkan keuntungan berasal dari unstructured data. Hal ini terbukti dengan semakin banyaknya perusahaan yang tumbuh karena memiliki banyak data mengenai pelanggannya, baik itu dalam bentuk structured maupun unstructured data. Sebagai contoh adalah Google yang selalu mencatat informasi kita saat kita melakukan apapun dalam ekosistemnya dan mengubahnya menjadi informasi bisnis bagi para advertisers. Oleh karena itu, solusi Big Data pada umumnya adalah untuk mendapatkan informasi bisnis baik dari data terstruktur maupun tidak terstruktur.
Aliran Proses Data
Serupa dengan konsep Data Flow Diagram pada aplikasi, bahwa aliran data dimulai dari inputan oleh pengguna, disimpan pada basis data, sampai dengan diproses oleh aplikasi. Untuk memberikan pemahaman mengenai the value chain of data maka perlu dijelaskan terlebih dahulu mengenai konsep data generation and acquisition.
Value chain dari Big Data terdiri empat fase yaitu: data generation, data acquisition, data storage, dan data analysis. Data generation dan data acquisition merupakan proses produksi dan eksploitasi data, sedangkan data storage adalah proses penyimpanan data, dan data analysis adalah sebuah proses menganalisa data menjadi sebuah informasi. Semua alur value chain dari pemrosesan data ini bertujuan untuk dapat mengubah raw material (data) yang dihasilkan sistem saat data generation yang kemudian disimpan sebagai data source menjadi sebuah nilai yang bermanfaat yakni hasil keluaran dari tahapan data analysis.
Data generation adalah langkah awal dari implementasi Big Data untuk memproduksi data. Data yang dihasilkan dari data generation ini ada dua jenis yaitu data yang dihasilkan dari sistem internal dan data yang dihasilkan dari internet, data internet misalnya keywords google, data postingan forum, rekaman chatting digital, microblog, dan sebagainya. Data internet tersebut seringkali berkaitan dengan aktivitas sehari-hari dan biasanya bersifat individual, namun jika diakumulasi dan dipetakan secara benar, data tersebut dapat menghasilkan informasi yang memiliki nilai manfaat seperti identifikasi kebiasaan pengguna, prediksi perilaku masyarakat maupun sentimen masyarakat terhadap sebuah isu tertentu. Contohnya ketika Kementerian Keuangan ingin melihat respons masyarakat terhadap sebuah kebijakan maupun program yang sedang dicanangkan maka data-data dari media sosial merupakan salah satu data source utama yang menyimpan informasi potensial. Karena data media sosial real time dapat mencerminkan sentimen masyarakat terhadap kebijakan pemerintah tersebut.
Data acquisition adalah langkah selanjutnya dari aliran data, yaitu untuk mengambil dan mengolah data untuk ditempatkan pada Data Warehouse atau Data Mart. Data storage adalah langkah untuk menampung data hasil pengolahan pada proses data acquisition. Umumnya, hasil pemrosesan data ini ditampung pada data warehouse untuk digunakan sebagai bahan analisis prediksi, pemodelan, maupun machine learning. Terakhir, data analysis adalah langkah terakhir untuk memanfaatkan data untuk mengatasi permasalahan bisnis dan mencari peluang baru.
Boleh minta email mas ? Ada yang ingin saya tanyakan masalah wordpress.
Di artikel mas yg masalah tombol subscribe pasang perintahnya di single php. Saya mau pindah ke function php di theme child. Masalahnya kodenya html bukan php
Mas saya ingin bertanya, bagaimana caranya membeli server sendiri. Apakah portal berita menggunakan server sendiri atau pakai paket hosting jasa orang lain. dan apakah membutuhkan dana yang besar?
Pertumbuhan dan penyimpanan data berkembang secara pesat sejak kita memasuki zaman digital. Data acquisition adalah langkah selanjutnya dari aliran data, yaitu untuk mengambil dan mengolah data untuk ditempatkan pada Data Warehouse atau Data Mart
SIlakan mas, bisa hubungi saya di budi.satrio at outlook.com. Atau bisa juga dengan mencari artikel-artikel saya yang lain