温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
本节课我们来讨论一下h base的体系架构。H base属于nasco数据库的一种,因此简单介绍一下nasco nasco是not only SQL的缩写,它泛指所有的非关系型数据库。这里介绍几个常见的nasco数据库。1、h base h base是基于谷歌的big table思想而实现的一个nasco数据库,它基于hadoop hdfs之上,并将所有数据存入HDFS 2、reddis radis是基于内存的开源nasco数据库,不论读写操作都是在内存上完成,完全吊打磁盘数据库的速度,它是一个高性能的建制数据库。3、manggo DB, 它是一个基于分布式文件存储的nasco数据库,是非关系型数据库当中功能最丰富、最像关系型数据库的nasco数据库。有了这些基本的知识,下面详细讨论一下h base的体系架构。H base最底层是HDFS,它将所有的表和数据以目录。
01:00
库或者文件的形式存储在HDFS中。H base是一种主从式架构,主节点是h masterster, 它负责从节点上region的分配及数据库的创建和删除等操作。Region server是h base的从节点,它负责数据的读写操作。当客户端在region server上执行操作时,Waal会记录客户端的操作日志,它是write ahead login的缩写,是一种高效的日志算法,相当于Oracle中的redo logg或者是MYSQL中的binglog waal的基本原理是在数据写入之前先顺序写入日志,然后再将数据写入缓存,等到缓存的数据写满之后,统一进行数据的持久化,将数据保存到HDFS中。Region server上还包含一个或者多个region,可以把region理解成是表中的列足,但一个列足可以对应多个region region是真正存储数据的逻辑单元,其中还包含了写缓存memory store和读缓存block。
02:00
Cashsh在一个h base集群中,这样的region server可以有多个客户端,需要通过zookeeper将操作提交给主节点h master zooukeeper在h base中的作用非常重要,主要体现在两个方面,1、存储h base的源信息,2、帮助实现h base h ha的功能。这里的ha是high availability的缩写,它是解决单点故障的解决方案。现在你已经知道h base的体系架构了,那你知道h base读写数据的原理吗?欢迎评论区留言讨论好了,记得点加号关注赵玉强老师。
我来说两句