Mempelajari Secara Singkat Hadoop : Apa itu HBase Read

Pembacaan HBase Pembacaan pada HBase harus direkonsiliasi antara HFiles, MemStore, dan BlockCache. BlockCache dirancang untuk menyimpan data yang sering diakses dari HFiles dalam memori guna menghindari pembacaan dari disk. Setiap keluarga kolom memiliki BlockCache sendiri. BlockCache berisi data dalam bentuk ‘blok’, sebagai unit data yang dibaca HBase dari disk dalam satu kali lewat. HFile secara fisik disusun sebagai rangkaian blok ditambah indeks di atas blok-blok tersebut. Ini berarti membaca blok dari HBase hanya memerlukan pencarian lokasi blok tersebut dalam indeks dan mengambilnya dari disk.

Blok: Ini adalah unit data terkecil yang diindeks dan merupakan unit data terkecil yang dapat dibaca dari disk. Ukuran default adalah 64KB.

Skenario ketika ukuran blok yang lebih kecil lebih disukai: Untuk melakukan pencarian acak. Memiliki blok yang lebih kecil menciptakan indeks yang lebih besar dan dengan demikian mengonsumsi lebih banyak memori.

Skenario ketika ukuran blok yang lebih besar lebih disukai: Untuk sering melakukan pemindaian berurutan. Ini memungkinkan penghematan memori karena blok yang lebih besar berarti lebih sedikit entri indeks dan dengan demikian indeks yang lebih kecil.

Membaca sebuah baris dari HBase memerlukan pengecekan pertama pada MemStore, kemudian BlockCache, dan akhirnya HFiles pada disk diakses.

referensi : [1][2]

By PuTI | 21 Juni 2024 | Berita | 0 Comments |

Mempelajari Secara Singkat Hadoop : Apa itu HBase Read

Mempelajari Secara Singkat Hadoop : Apa itu HBase Read

PuTI

Mempelajari Secara Singkat Hadoop : Mengenal HBase

Komponen Web Service

Cancel reply

Tinggalkan Balasan

Link Terkait

Hubungi Kami