HBase Architecture
先來看一張圖。

HBase 架構中有三個重要的角色,分別是
HMaster :
Master 會將 Region 指派給 Region Server,並也從中平衡各個 Region Server 的負載。
若有 Region Server 失效,便會重新分配其上的 Region。
我們可以有多個 HMaster ,透過 Zookeeper 管理,做到 Active & Standby 的機制。
處理 Schema 更新的請求。
Region Server :
管理著及維護HMaster 指派給他的 Region;並處理這些 Region 的 I/O 請求。
當 Region 過大時會對他做切分的動作。
Client 可直接透過 Region Server 做 I/O 請求。
Zookeeper :
保證任何時候 HMaster 只有一個在執行中。
存著所有 Region 的 meta data,以及由哪個 Region Server 所管理。
監控 Region Server 狀態,即通報 HMaster。
存著 HBase 的schema,包括有哪些 table,每個 table 有哪些 column Family。
而在這架構之下的 Data node , 即是 HDFS 的部份。
Region (待修正) :
Region 是 HBase 儲存資料的單位
每個 Region 都只存儲一個 Column Family 的資料 (?
用 memory 運算較為快速,進到 Region 的資料會先存在 memStore,
memStore 滿了就會將資料放入 StoreFile。
當 Region 過大到超過 Threshold 踏就會自動分割出另外一個 Region ,以此達成分散式儲存的效果。
start key
end key
Last updated
Was this helpful?