Hbase 學習紀錄
  • Introduction
  • HBASE 資料儲存格式
    • Row (Row Key)
    • Column Family
    • Time stamp
  • HBase Architecture
    • HBase 的操作方法
  • HBase 運作機制的聰明運用
Powered by GitBook
On this page
  • HMaster :
  • Region Server :
  • Zookeeper :
  • Region (待修正) :

Was this helpful?

HBase Architecture

PreviousTime stampNextHBase 的操作方法

Last updated 5 years ago

Was this helpful?

先來看一張圖。

HBase 架構中有三個重要的角色,分別是

HMaster :

  • Master 會將 Region 指派給 Region Server,並也從中平衡各個 Region Server 的負載。

  • 若有 Region Server 失效,便會重新分配其上的 Region。

  • 我們可以有多個 HMaster ,透過 Zookeeper 管理,做到 Active & Standby 的機制。

  • 處理 Schema 更新的請求。

Region Server :

  • 管理著及維護HMaster 指派給他的 Region;並處理這些 Region 的 I/O 請求。

  • 當 Region 過大時會對他做切分的動作。

  • Client 可直接透過 Region Server 做 I/O 請求。

Zookeeper :

  • 保證任何時候 HMaster 只有一個在執行中。

  • 存著所有 Region 的 meta data,以及由哪個 Region Server 所管理。

  • 監控 Region Server 狀態,即通報 HMaster。

  • 存著 HBase 的schema,包括有哪些 table,每個 table 有哪些 column Family。

而在這架構之下的 Data node , 即是 HDFS 的部份。

Region (待修正) :

  • Region 是 HBase 儲存資料的單位

  • 每個 Region 都只存儲一個 Column Family 的資料 (?

  • 用 memory 運算較為快速,進到 Region 的資料會先存在 memStore,

  • memStore 滿了就會將資料放入 StoreFile。

  • 當 Region 過大到超過 Threshold 踏就會自動分割出另外一個 Region ,以此達成分散式儲存的效果。

  • start key

  • end key