Hive与 HBase各有各的功能,各有各的特点,但归根结底, hive与 hbase的数据最终都存储在 hdfs之上,一般我们用 hdfs来存储磁盘空间,不会将一个数据存储到多个地方,造成浪费磁盘空间,我们可以直接将数据存入 hbase,然后通过 hive整合 hbase,直接使用 sql语句分析 hbase内部的数据,这样就很方便
需求一:将hive分析结果的数据,保存到HBase当中去
1、拷贝hbase的五个依赖jar包到hive的lib目录下
将我们HBase的五个jar包拷贝到hive的lib目录下
hbase的jar包都在/export/servers/hbase-1.2.0-cdh5.14.0/lib
我们需要拷贝五个jar包名字如下
在node03中,我们通过创建软连接的方式直接执行以下命令,以实现 jar包的依赖性
2、修改hive的配置文件
编辑node03服务器上面的hive的配置文件hive-site.xml添加以下两行配置
3、修改hive-env.sh配置文件添加以下配置
4、hive当中建表并加载以下数据
hive当中建表
进入hive客户端
创建hive数据库与hive对应的数据库表
准备数据内容如下
加载数据格式如下
进行加载数据
进入hive客户端进行加载数据
5、创建hive管理表与HBase进行映射
通过在 hbase中创建一个与 hbase中的表进行映射的 hive管理表,将 hbase中的数据存储到 hbase中
hive当中创建内部表
通过insert overwrite select 插入数据
6、hbase当中查看表hbase_score
进入hbase的客户端查看表hbase_score,并查看当中的数据
需求二:创建hive外部表,映射HBase当中已有的表模型,直接通过
1、HBase当中创建表并手动插入加载一些数据
进入HBase的shell客户端,手动创建一张表,并插入加载一些数据进去
操作成功结果如下:
2、建立hive的外部表,映射HBase当中的表以及字段
在hive当中建立外部表,
进入hive客户端,然后执行以下命令进行创建hive外部表,就可以实现映射HBase当中的表数据
到此整合成功!!!!!!!!!!!!
如果觉得对你有所帮助。记得收藏和关注呦!(每日更新各种大数据框架)
如需转载请注明出处(创作不易请见谅)
和巨婴程序猿一起成长。让自己变得更优秀
想了解更多精彩内容,快来关注跟着巨婴去逆袭
我最近一直在思考(大数据通俗讲解)的问题,你的看法是什么呢?关注我快说出来一起交流一下吧~
领取专属 10元无门槛券
私享最新 技术干货