HBase Architecture
Last updated
Was this helpful?
Last updated
Was this helpful?
先來看一張圖。
HBase 架構中有三個重要的角色,分別是
Master 會將 Region 指派給 Region Server,並也從中平衡各個 Region Server 的負載。
若有 Region Server 失效,便會重新分配其上的 Region。
我們可以有多個 HMaster ,透過 Zookeeper 管理,做到 Active & Standby 的機制。
處理 Schema 更新的請求。
管理著及維護HMaster 指派給他的 Region;並處理這些 Region 的 I/O 請求。
當 Region 過大時會對他做切分的動作。
Client 可直接透過 Region Server 做 I/O 請求。
保證任何時候 HMaster 只有一個在執行中。
存著所有 Region 的 meta data,以及由哪個 Region Server 所管理。
監控 Region Server 狀態,即通報 HMaster。
存著 HBase 的schema,包括有哪些 table,每個 table 有哪些 column Family。
而在這架構之下的 Data node , 即是 HDFS 的部份。
Region 是 HBase 儲存資料的單位
每個 Region 都只存儲一個 Column Family 的資料 (?
用 memory 運算較為快速,進到 Region 的資料會先存在 memStore,
memStore 滿了就會將資料放入 StoreFile。
當 Region 過大到超過 Threshold 踏就會自動分割出另外一個 Region ,以此達成分散式儲存的效果。
start key
end key