Mempelajari Secara Singkat Hadoop : Apa itu HBase Read

Pembacaan HBase Pembacaan pada HBase harus direkonsiliasi antara HFiles, MemStore, dan BlockCache. BlockCache dirancang untuk menyimpan data yang sering diakses dari HFiles dalam memori guna menghindari pembacaan dari disk. Setiap keluarga kolom memiliki BlockCache sendiri. BlockCache berisi data dalam bentuk ‘blok’, sebagai unit data yang dibaca HBase dari disk dalam satu kali lewat. HFile secara fisik disusun sebagai rangkaian blok ditambah indeks di atas blok-blok tersebut. Ini berarti membaca blok dari HBase hanya memerlukan pencarian lokasi blok tersebut dalam indeks dan mengambilnya dari disk.

Blok: Ini adalah unit data terkecil yang diindeks dan merupakan unit data terkecil yang dapat dibaca dari disk. Ukuran default adalah 64KB.

Skenario ketika ukuran blok yang lebih kecil lebih disukai: Untuk melakukan pencarian acak. Memiliki blok yang lebih kecil menciptakan indeks yang lebih besar dan dengan demikian mengonsumsi lebih banyak memori.

Skenario ketika ukuran blok yang lebih besar lebih disukai: Untuk sering melakukan pemindaian berurutan. Ini memungkinkan penghematan memori karena blok yang lebih besar berarti lebih sedikit entri indeks dan dengan demikian indeks yang lebih kecil.

Membaca sebuah baris dari HBase memerlukan pengecekan pertama pada MemStore, kemudian BlockCache, dan akhirnya HFiles pada disk diakses.

referensi : [1][2]

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *