温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
本节课我们来讨论一下haveve的外部表。Haveve支持创建外部表。当创建haveve的外部表时,Haveve将表的源信息存储在MYSQL中,这里的原信息指的是表的结构信息,如表名列名列的类型等,并将表的数据目录指向HDFS。当删除haveve的外部表时,只会删除MYSQL中的源信息,而不会从HDFS上删除数据文件。这是hive的内部表与外部表最大的区别。注意,外部表可以指向任意的HDFS目录,因此haveve的外部表本质上是一个目录连接。了解到了这些基本的信息后,下面通过一个具体的事例来演示如何创建hive的外部表。首先在本地创建测试用的数据文件STUDENT1TXT和STUDENT02TXT,这里一共包含了三条学生数据,将这两个数据文件上传到HDFS的任意目录,例如,这里的student目录在hive中创建。
01:00
件外部表指向该HDFS目录,这里的关键字external表示这是一张外部表,而关键字location则指向了HDFS的目录。接下来就可以使用select语句查询表中的数据了。现在你已经知道如何使用haveve的外部表了,那你知道如何创建have的其他表结构吗?欢迎评论区留言讨论好了,记得点加号关注赵玉强老师。
我来说两句