Big Data
Big Data, Karakteristik, Teknologi dan Klasifikasi Big Data Big Data. Big Data adalah sebuah istilah yang mendeskripsikan data dengan jumlah yang sangat besar. Tidak hanya besar, big data juga mempunyai volume, variasi data besar, serta kecepatan proses perpindahan data yang sangat tinggi dan sangat banyak serta bervariasi, baik data terstruktur maupun data tidak terstruktur. Big data sangat berhubungan dengan data yang besar yang harus dianalisis secara eksekusional yang berhubungan dengan pola, trend dan assosiasi terutama dengan kebiasaan manusia. Dan tentunya big data juga sangat terkait dengan kecepatan perpindahan data yang tinggi untuk mampu menyimpan, memproses dan menganalisa data. (Ajin, 2015)
Big data menghasilkan data yang sangat besar tiap menit bahkan tiap detiknya sehingga membutuhkan teknik khusus untuk menangani permasalahan pada big data. Permasalahan pada big data tidak dapat diselesaikan dengan cara tradisional. Melainkan harus menggunakan teknik tertentu untuk meminimalkan waktu eksekusi, mencari pola tertentu dan menganalisa pola tersebut. (Ajin, 2015)
Big Data mencari teknik tidak hanya untuk penyimpanan tetapi juga untuk mengekstrak dan menemukan informasi yang tersembunyi di dalamnya. Dan akan menjadi sangat sulit untuk karakteristik yang data sangat besar. Karakteristik khas yang menampungnya berbeda dari sistem basis data (database) tradisional, berbeda dari segi volume, variety, velocity dan Value. (Mohanty, H, 2015)
Big Data adalah istilah yang menggambarkan volume data yang besar, baik data yang terstruktur maupun data yang tidak terstruktur. Big Data telah digunakan dalam banyak bisnis. Tidak hanya besar data yang menjadi target utama tetapi langkah apa yang harus dilakukan organisasi dengan data tersebut. Big Data dapat dianalisis untuk wawasan yang mengarah pada pengambilan keputusan dan strategi bisnis yang lebih baik.
Karakteristik Big Data
Ada 5 karakteristik yang menjadi tantangan dalam pada big data, yaitu sebagai berikut.
- Volume. Streaming data yang tidak terstruktur dalam bentuk media sosial dan muncul pertanyaan seperti bagaimana menentukan relevansi dalam volume data yang besar dan bagaimana menganalisis data yang relevan untuk diproduksi informasi berharga.
- Velocity. Data membanjiri dengan kecepatan yang sangat tinggi dan harus ditangani secara cepat dan dengan waktu yang cendurung wajar. Menanggapi kecepatan data dengan cepat adalah salah satu tantangan dalam data besar/ big data.
- Variety. Masalah lain yang menantang adalah mengelola, menggabungkan, dan mengatur data itu berasal dari berbagai sumber dengan spesifikasi berbeda seperti: email, audio, data tidak terstruktur, data sosial, video dan lain-lain
- Variabilitas. Ketidakkonsistenan dalam aliran data adalah tantangan lain. Misalnya di bidang sosial media bisa berupa data puncak harian atau musiman yang membuatnya lebih sulit untuk ditangani dan mengelola data secara khusus ketika data tidak terstruktur.
- Kompleksitas. Data berasal dari sumber yang berbeda dan memiliki struktur yang berbeda. akibatnya perlu untuk menghubungkan dan menghubungkan hubungan tiap data agar data tidak menjadi di luar kendali dengan cepat.
Dari kelima karakteristik yang menjadi tantangan didalam big data, maka apabila mampu di analisis dengan baik dapat menghasilkan semua value/nilai yang sangat berharga bagi pemilik data atau organisasi yang menanganin data tersebut. (Nithya, 2017)
Teknologi dan Klasifikasi Big Data
Teknologi Big Data memiliki kemampuan untuk menangani berbagai variasi data. Secara umum ada 2 kelompok data yang harus dikelola, yaitu :
Data terstruktur Kelompok data yang memiliki tipe data, format, dan struktur yang telah terdefinisi. Sumber datanya dapat berupa data transaksional, OLAP data, tradisional RDBMS, file CSV, spreadsheets.
Data tidak terstruktur Kelompok data tekstual dengan format tidak menentu atau tidak memiliki struktur melekat, sehingga untuk menjadikannya data terstruktur membutuhkan usaha, tools, dan waktu yang lebih. Data ini dihasilkan oleh aplikasi-aplikasi internet, seperti data URL log, media sosial, e-mail, blog, video, dan audio. (Ajin, 2015)
Sumber Pustaka
Ajin, V.W. & Kumar, L.D. 2015. Big Data and Clustering Algorithms. International Conference on Research Advances in Integrated Navigation Systems (RAINS) 8:978-985.
Mohanty, H ., Bhuyan, P., Chenthati, D. 2015. Big Data : A Primer . Springer New Delhi Heidelberg New York Dordrecht London
Nithya, P. & Kalpara, A.M. 2017. Big Data Clustering Algorithm and Strategies. International Journal on Recent and Innovation Trends in Computing and Communication 5(6):1387-1391.