温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
本节课我们来讨论一下haveve的数据模型。Haveve是基于hadoop之上的数据仓库平台,它支持使用SQL语句来处理存储在hadoop中的大数据。Haveve主要支持以下六种数据模型,一、内部表,内部表与关系型数据库中的表是一样的,使用create table语句创建,并且每张表在HDFS上都会对应一个目录。二、外部表与内部表不同的是,外部表可以将数据存在HDFS的任意目录下,它的本质是建立一个指向HDFS上已有数据的链接。3、分区表。Hive的分区表跟关系型数据库中分区表的概念是一样的,通过建立分区可以避免全表扫描,从而提高查询的效率。四、统表,统表的本质其实是哈希分区,统表中的统是一个文件,不是目录,通过建立统表,可以实现数据的分布式存储。5、临时表,临时表的原信息和数据只存在于当前会话中。
01:00
如果退出当前会话,Haveve会自动删除临时表的原信息,并删除表中的数据。6、视图视图是一种虚表,它本身不存储数据,通过建立视图可以简化复杂的查询。现在你已经知道have支持哪些数据模型了,那你知道这些数据模型的表如何创建吗?欢迎评论区留言讨论好了,记得点加号关注赵玉强老师。
我来说两句