首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >hbase拾遗「建议收藏」

hbase拾遗「建议收藏」

作者头像
全栈程序员站长
发布2022-08-09 16:04:40
发布2022-08-09 16:04:40
2070
举报

大家好,又见面了,我是你们的朋友全栈君。

1,hbase 全称:hadoop dataBase ,即hadoop数据库

2,使用场景:大数据量,准实时查询

3,特点:面向列,支持独立索引,每个列支持存储多版本,稀疏性:空列不占内存,可随意做列扩展,传统DB无数据的列会以null填充。因为hbase是基于hdfs 的所以具有扩展性、高可用性、动态增加DataNode、高性能:LSM数据结构(子节点不断合并成主节点),分区(region)存储数据。

4,Hbase内两个主要进程服务:

Master 和regionServer。master做管理,监控调度各regionServer。

一个regionServer管理多个region区,每个regionServer服务定时像master报告健康状态和存储内容。

regionServer可通过向master报告健康状态达到高可用性,即一个regionServer服务挂掉后,可由其他regionserver来管理挂掉服务下的region

5,zookeeper可接受到同master来自regionServer报告的信息

6,对比关系性数据库|:列动态增加,数据自动切分,高并发读写

缺点:不支持条件查询

7,删除表:要先禁用disable禁用表,在drop删除表。

8,列在列簇中有序,列数没有限制,一张表列簇不会超过5个,列只有插入数据后才存在。

图示说明hbase存储结构:

Hbase智能分区

RowKey

TimeStamp

Column Family1(列簇)

Column Family2(列簇)

Column Family3(列簇)

Region-1

11111

t6

C1:name

小三

t5

c1:age

25

t4

c1:tel

1.23457E+11

Region-2

21111

t3

c1:name

小四

t2

c1:age

30

c2:collage

北京大学

c3:job1

CEO

t1

c1:tel

5647876213

对应说明,联想简历样式

个人信息列簇

教育经历列簇

工作经历列簇

姓名

年龄。。等

大学

研究生等

工作1

工作2

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/105976.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年4月2,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档