Mempelajari Secara Singkat Hadoop : Mengenal HBase
HBase adalah data peta terurut sumber terbuka yang dibangun di atas Hadoop. HBase berorientasi kolom dan dapat diskalakan secara horizontal.
Berdasarkan Google’s Big Table, HBase memiliki serangkaian tabel yang menyimpan data dalam format kunci-nilai. HBase sangat cocok untuk set data yang jarang, yang sangat umum dalam kasus penggunaan big data. HBase menyediakan API yang memungkinkan pengembangan dalam hampir semua bahasa pemrograman. HBase adalah bagian dari ekosistem Hadoop yang menyediakan akses baca/tulis acak secara real-time ke data dalam Hadoop File System.
Mengapa HBase
- RDBMS menjadi sangat lambat saat data menjadi besar.
- Mengharapkan data sangat terstruktur, yaitu kemampuan untuk sesuai dengan skema yang terdefinisi dengan baik.
- Setiap perubahan dalam skema mungkin memerlukan waktu henti.
- Untuk set data yang jarang, terlalu banyak overhead untuk mempertahankan nilai NULL.
Fitur HBase
- Dapat Diskalakan Secara Horizontal: Kolom dapat ditambahkan kapan saja.
- Failover Otomatis: Failover otomatis adalah sumber daya yang memungkinkan administrator sistem untuk secara otomatis mengalihkan penanganan data ke sistem siaga jika terjadi kompromi sistem.
- Integrasi dengan Kerangka Kerja Map/Reduce: Semua perintah dan kode Java secara internal mengimplementasikan Map/Reduce untuk melakukan tugas dan dibangun di atas Hadoop Distributed File System.
- Peta Terurut Multidimensi, Persisten, Terdistribusi dan Jarang: Diindeks oleh rowkey, column key, dan timestamp.
- Sering Dikenal sebagai Toko Kunci-Nilai atau Basis Data Berorientasi Keluarga Kolom: Atau penyimpanan peta versi dari peta.
- Platform untuk Menyimpan dan Mengambil Data dengan Akses Acak: Tidak peduli tentang tipe data (menyimpan integer di satu baris dan string di baris lain untuk kolom yang sama).
- Tidak Menegakkan Hubungan dalam Data: Dirancang untuk berjalan di kluster komputer, dibangun menggunakan perangkat keras komoditas.