温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
本节课我们来讨论一下haveve的内部表。Haveve的内部表与关系型数据库中的表是一样的,使用create table语句创建表,创建成功后,表的原信息会存储在MYSQL数据库中,这里的原信息指的是表的结构信息,如表名、列名列的类型等。当把数据加载到内部表中后,将存储在HDFS目录下的文件中。删除Hive内部表的时候,会同时删除MYSQL中表的原信息和HDFS上的数据文件。了解到了这些基本的信息后,在haveve的命令行工具中使用create table语句创建一张员工表,用于保存员工信息。注意,这里的roll format指定了数据文件的分隔服务,是逗号。这里的8个列分别表示员工号、员工姓名、职位、老板号、入职日期、月薪、奖金和部门号。内部表所对应的目录将默认创建在HDFS的user haveve warehouse目录下,内部表创建成功。
01:00
后便可以使用load Beta语句将数据加载到表中,该语句既可以加载本地数据文件,也可以加载HDFS数据文件。关键字Local表示这里加载的是一个本地数据文件。接下来就可以使用select语句查询表中的数据了。Have可以将这条select语句转换成是一个map reducece任务或者是Spark任务。现在你已经知道如何使用haveve的内部表了,那你知道如何创建have的其他表结构吗?欢迎评论区留言讨论好了,记得点加号关注赵宇强老师。
我来说两句