, 不能改)
2) 在Hbase的2.0版本后, 这个管道中数据, 会尽可能晚刷新到磁盘中, 一直存储在内存中, 随着memStore不断的溢写, 管道中数据也会不断的变多
3) 当管道中数据,...达到一定的阈值后, hbase就会启动一个flush的刷新线程, 对pipeline管道中数据一次性全部刷新到磁盘上,而且在刷新的过程中, 对管道中数据进行排序合并压缩操作, 在HDFS上形成一个合并后的...:
basic(基础型):
说明: 仅做作为基本的合并, 不会对过期数据进行清除操作
优点: 效率高 ,适合于这种有大量写的模式
弊端: 如果数据中大多数都是已经过期的时候, 此时做了许多无用功..., 对磁盘IO也会比较大
eager(饥渴型):
说明: 在合并的过程中, 尽可能的去除过期的无用的数据, 保证合并后数据在当下都是可用的
优点: 合并后的文件会较少, 对磁盘IO比较低...扫描zookeeper上的server父节点,获得当前可用的region server列表
和每个region server通信,获得当前已分配的region和region server的对应关系
扫描