Mempelajari Secara Singkat Hadoop : Fitur dan Tujuan HDFS
Fitur dan Tujuan HDFS
Hadoop Distributed File System (HDFS) adalah sistem file terdistribusi. Ini adalah bagian inti dari Hadoop yang digunakan untuk penyimpanan data. HDFS dirancang untuk berjalan pada perangkat keras komoditas.
Berbeda dengan sistem file terdistribusi lainnya, HDFS sangat toleran terhadap kesalahan dan dapat diimplementasikan pada perangkat keras berbiaya rendah. HDFS mampu menangani aplikasi yang berisi set data besar dengan mudah.
Berikut beberapa fitur dan tujuan penting dari HDFS.
Fitur HDFS Sangat Skalabel
- HDFS sangat skalabel karena dapat mengatur ratusan node dalam satu kluster.
- Replikasi – Karena beberapa kondisi yang tidak menguntungkan, node yang mengandung data mungkin hilang. Untuk mengatasi masalah tersebut, HDFS selalu mempertahankan salinan data pada mesin yang berbeda.
- Toleransi Kesalahan – Dalam HDFS, toleransi kesalahan menunjukkan ketangguhan sistem saat terjadi kegagalan. HDFS sangat toleran terhadap kesalahan, sehingga jika ada mesin yang gagal, mesin lain yang berisi salinan data tersebut akan otomatis aktif.
- Penyimpanan Data Terdistribusi – Ini adalah salah satu fitur paling penting dari HDFS yang membuat Hadoop sangat kuat. Data dibagi menjadi beberapa blok dan disimpan dalam node-node.
- Portabilitas – HDFS dirancang sedemikian rupa sehingga dapat dengan mudah dipindahkan dari satu platform ke platform lainnya.
Tujuan HDFS
- Menangani Kegagalan Perangkat Keras – HDFS mengandung beberapa mesin server. Jika ada mesin yang gagal, tujuan HDFS adalah untuk segera memulihkannya.
- Akses Data Streaming – Aplikasi HDFS biasanya berjalan pada sistem file umum. Aplikasi ini membutuhkan akses streaming ke set data mereka.
- Model Koherensi – Aplikasi yang berjalan di HDFS harus mengikuti pendekatan write-once-read-many. Jadi, file yang sudah dibuat tidak perlu diubah. Namun, file tersebut dapat ditambahkan dan dipotong.