首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Hive-数据仓库

Hive-数据仓库

作者头像
凹谷
发布2020-04-11 10:49:20
发布2020-04-11 10:49:20
7580
举报

交互方式-用户接口:CLI(linux命令行)、WUI(hive web页面)、Client(连接远程服务HiveServer2,eg:JDBC、ODBC)

Hive命令行模式:

1、进入bin 执行./hiv

2、配置Hive环境变量,直接执行命令:hive --service cli 或 hive

Hive的web模式:

执行hive -service hwi 启动后访问http://master:9999/hwi

Hive的远程服务:

默认端口:10000,执行启动命令:nobup hive --service hiveserver2 &

元数据存储:hive是将元数据存储在mysql或者Derby等,元数据主要依赖MetastoreDB服务

hive数据模型包括表、外部表、分区、桶

解析器、编译器、优化器:完成HQL语法解析,由MapReduce执行

数据存储:存储在HDFS中

HiveQL:用于分析处理存储在HDFS中的结构化数据,它不支持事务及更新操作,延迟比较大

数据库操作:创建内表、创建外表(external关键字,删除表只删除了元数据信息,不删数据)、 创建静态分区表、创建动态分区表、创建带有数据的表 (create table xx as select xx from table)

数据导入:本地与HDFS导入、单表插入、多表插入

数据导出:导出数据到本地及HDFS

HiveQL查询:兼容大部分sql语法,不支持更新和事务

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-01-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据与微服务架构 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档