Pernah mendengar istilah Big Data sebelumnya? Pasti dalam kumpulan data yang besar di dalamnya terdapat berbagai macam jenis atau variasi data. Variasi data biasanya bisa dilihat dari struktur data ataupun format berkas yang didapatkan.
Nah, setelah kita mengetahui tentang jenis data seperti kualitatif dan kuantitatif, selanjutnya kita akan belajar tentang data terstruktur dan data tidak terstruktur.
Perbedaan yang mendasar di antara keduanya adalah data terstruktur sangat terorganisir dan disusun sedemikian rupa sehingga mudah dicari dalam database relasional. Sementara data yang tidak terstruktur tidak memiliki format atau organisasi yang ditentukan sebelumnya. Akibatnya mengumpulkan, memproses, dan menganalisa data jadi jauh lebih sulit.
Data Terstruktur
Pernahkah Anda melihat data dalam sebuah pengolah angka? Biasanya data tersebut tersaji dalam bentuk baris dan kolom serta memiliki nilai di dalamnya. Salah satu contohnya adalah kartu stok atau data penjualan di supermarket digambarkan dalam bentuk tabel berisi nama barang, stok barang, tanggal penjualan, dan sebagainya.
Data terstruktur tersusun dengan rapi dan mudah dipahami oleh bahasa mesin. Sehingga orang yang bekerja dalam basis data relasional dapat memasukkan, mencari, dan memanipulasi data terstruktur dengan lebih cepat. Inilah yang termasuk kelebihan dari data terstruktur.
Data Tidak Terstruktur
Berbeda dengan data terstruktur, data tidak terstruktur lebih beragam jenisnya dan tidak memiliki struktur khusus contohnya seperti data dalam bentuk teks, audio, video, data dari sosial media, dan lainnya. Mesin juga dapat menghasilkan data tidak terstruktur juga, lho. Sehingga perlu pengolahan data dan analisis lebih lanjut untuk dapat dipahami. Salah satu contohnya adalah citra satelit yang menghasilkan data cuaca.
Pasti selama ini kita hanya mengetahui hasil dari prakiraan cuaca seperti mendung, hujan dan panas. Namun dibalik itu data yang dikirimkan dari satelit pastinya berupa data tidak beraturan sehingga perlu pemrosesan khusus terlebih dahulu.
Data Semi Terstruktur
Data semi terstruktur merupakan penggabungan antara data terstruktur dan tidak terstruktur. Mengapa demikian? Data semi terstruktur memiliki informasi yang tidak berada di basis data relasional atau tabel data lainnya, namun tersusun dengan rapi sehingga membuatnya lebih mudah untuk dianalisis. Biasanya data semi terstruktur dipisahkan dengan tanda hubung tertentu seperti koma, titik koma, dan lainnya bergantung pada aturan penulisan dari data tersebut. Contoh dari data semi terstruktur adalah XML dan JSON.
Dari sini kita dapat menyimpulkan bahwa terdapat data yang bisa dibaca oleh manusia dengan mudah dan sebaliknya, ada pula data yang membingungkan karena hanya mampu terbaca oleh mesin atau komputer. Contoh data sederhana untuk manusia seperti sebuah bola tenis berwarna kuning dalam keadaan baru tersebut berjumlah 3 buah. Kita bisa memahami data tersebut dengan mudah. Namun, apabila kalimat tersebut diberikan pada komputer maka pemrosesan sulit dilakukan. Sehingga apabila ingin diproses dalam komputer perlu pemisahan berdasarkan kategori masing-masing mulai dari nama objek, kondisi, warna, jumlah dengan masing-masing diberi nilai sesuai keterangan yang ada.
- {
- "object_name" : "Bola_Tenis",
- "condition" : "New",
- "color" : "Yellow",
- "quantity" : 3
- }
Komentar
Posting Komentar