首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >大数据入门与实战-Hive操作与SQL 查询

大数据入门与实战-Hive操作与SQL 查询

作者头像
致Great
发布2019-03-19 10:59:00
发布2019-03-19 10:59:00
7050
举报
文章被收录于专栏:自然语言处理自然语言处理

Hive的SQL基本上和我们原先的MYSQL的SQL查询效果差不多,下面是一些实例:

基本查询

  • 创建数据库 create databases hivedb; 我们可以看到会在/user/hive/warehouse 下面出现hivedb.db文件
  • 使用指定数据库 use hivedb;
  • 创建表create table test(id int,name string);
  • 删除表drop table test;

高级操作

  • hive中表的概念与关系型数据库中表的概念非常类似
  • hive中每张表都和DFS上/user/hive/warehouse(默认。此目录可以在${HIVE_HOME/conf/hive-sire.xml中设置})中的一个目录相关联。
  • 创建表 :
代码语言:javascript
复制
CREATE TABLE IF NOT EXISTS t_customer(id int,name string,age int,address string)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;
  • 导入本地数据: 我们将本地的txt文件中的数据导入表中
代码语言:javascript
复制
LOAD DATA LOCAL INPATH '/opt/datas/customer.txt' OVERWRITE INTO TABLE T_CUSTOMER;
  • 导入Hadoop数据 我们先将customer.txt上传到hdfs上
代码语言:javascript
复制
 hdfs dfs -mkdir /user/datas
 hdfs dfs -put /opt/datas/customer.txt /user/datas

然后将HDFS数据导入hive

代码语言:javascript
复制
LOAD DATA INPATH '/user/datas/customer.txt' INTO TABLE T_CUSTOMER;

我们可以看到源文件已经删除

但是在warehouse会保留备份

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019.03.12 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 基本查询
  • 高级操作
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档