温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
H base是基于Google的big table思想而实现的一个nasco数据库。H base基于hado hdfs之上,它将所有数据存入HDFS,在h base中创建一张表,表对应于HDFS的一个目录。H base的表由列组组成,列组也对应于HDFS的一个目录。列组中包含列,列上存储数据,数据对应于HDFS的一个文件。注意,H base中的列不需要事先创建,当插入数据时,如果列组中没有对应的列,H base会自动创建列。在讨论h base的表结构之前,先讨论一下关系型数据库的表结构。这里有两张表,部门表和员工表,他们由行和列组成,并且部门表和员工表之间通过部门号的外建进行关联。下面通过一个事例来讲解h base的表结构。执行create语句,在h base中创建employees员工表。创建表时需要指定表中的列组。例如,这里有两个列组,分别是EMP和dept,它们相当于关系型数据库中的员工表和部门表。表创建成功后,表的第一个字段是rockook key, 中文是行件,它相当于主键,但可以重复行件,相同的行是同一条记录。接下来可以使用put语句往表中插入数据。这里的employees是员工表,101是行建name是列组。Emmp中的列列可以动态创建,他们是该列上的值。按照同样的方式,可以在emmp列组中在创建salary列,用于保存该员工的薪水,这里的薪税是5000。也可以在其他列组上创建列。这里在dept列组上动态创建了一个列name,用于保存该员工所在部门的名字,在执行一条put语句,在dept列组上动态创建了一个列location,用于保存该部门所在的地点。在插入。
01:52
数据的时候也可以指定不同的行线。例如这里插入了一行新的记录,行线是102。尽管这里执行了5条插入语句,插入了5行数据,但h base的employees员工表中只存在两条记录,因为行件相同的行是同一条记录,前四条put语句操作的是同一行记录。现在你已经知道h base的表结构了,那你知道h base的物理存储结构吗?欢迎评论区留言讨论好了,记得点加号关注赵玉强老师。
我来说两句