首页
学习
活动
专区
圈层
工具
发布

Hive初步使用、安装MySQL 、Hive配置MetaStore、配置Hive日志《二》

一、Hive的简单使用     基本的命令和MySQL的命令差不多     首先在 /opt/datas 下创建数据 students.txt     1001  zhangsan     1002  ...二、 安装Mysql 将Mysql安装包上传到服务器上,然后解压压缩包,使用命令:unzip mysql-libs.zip ?...OK,退出Mysql之后在重新登录一下,登录成功! 三、Hive配置metastore    首先进入到Hive的安装目录中 /opt/moudles/hive-.....    ...这个就是Hive的元数据所创建的 四、Hive的基本使用 # 查看 所有的数据库 show databases ; # 创建数据库 create database db_hive ; # 创建一张数据表...; # 查看Hive中支持的命令 show functions ; # 显示某个功能的用法 desc function upper ; # 对这个功能的使用来一个Demo desc function

1.3K40
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Apache-Hive 使用MySQL存储Hive的元数据

    但是这样就会出现一个情况:Derby是单例的,当你在一个终端打开了hive时,在另外一个终端打开hive命令行会报错。所以使用MySQL来存储元数据能够解决这个问题,并且也更方便迁移和备份。...配置Mysql服务端 安装Mysql服务器之后,你需要配置允许root用户的登录权限 打开MySQL客户端 mysql -uroot -p 使用Mysql数据库 use mysql 查询user表 select...-8.0.21.jar,将jar包移动至 /opt/apache-hive-1.2.2-bin/lib 下 配置Hive中MySQL的连接 第一步,在Hive的conf目录中新建文件hive-site.xml...2、配置MySQL后,第一次打开hive的时候Cli无响应: 这个问题查阅了很多资料并没有找到更加详细的信息,但是经过DEBUG初步判断还是MySQL数据库的问题,导致Hive第一次启动时无法正常完成Metastore...的数据表的初始化,按照上述第三步,在启动Hive前初始化下数据表即可:使用 schematool -dbType mysql -initSchema 命令进行初始化。

    3.4K30

    配置Hive使用MySql存储元数据

    配置Hive使用MySql存储元数据 2018-7-24 作者: 张子阳 分类: 大数据处理 默认情况下,Hive会使用Derby来存储元数据(主要是表、列、分区Partition的信息)。...Hive支持使用单独的数据库来存储元数据,比如MySql、PostgreSql等,本文将介绍如何配置Hive使用MySql存储元数据。 本文假设你已经单机安装、配置好了MySql和Hive。...如果没有,可以参考下面两篇文章: 使用Docker安装和配置MySql Linux上安装和配置Hive 安装MySql连接器 前往:https://dev.mysql.com/downloads/connector...默认情况下,并没有这个文件,所有的参数配置在hive-default.xml.template中。因此,第一次使用时,需要手动创建这个文件。...MySql来存储Hive元数据的配置。

    4.1K50

    Hive Tips Hive使用技巧

    首先,Hive != SQL,虽然二者的语法很像,但是Hive最终会被转化成MapReduce的代码去执行,所以数据库的优化原则基本上都不适用于 Hive。...也正因如此,Hive实际上是用来做计算的,而不像数据库是用作存储的,当然数据库也有很多计算功能,但一般并不建议在SQL中大量使用计算,把数据库只当作存储是一个很重要的原则。...1、使用UDF (a)如果是已经上传到Hive服务器的UDF,可以直接用 create temporary function dosomething as 'net.hesey.udf.DoSomething...Hive中调用时的输入和返回值。...七、排序 在SQL中排序通过ORDER by实现,Hive中也支持这种语法,但是使用ORDER by时最终所有的数据会汇总到一个Reducer上进行排序,可能使得该Reducer压力非常大,任务长时间无法完成

    1.5K80

    Hive篇---Hive使用优化

    一.前述 本节主要描述Hive的优化使用,Hive的优化着重强调一个 把Hive SQL 当做Mapreduce程序去优化 二.主要优化点 1.Hive运行方式: 本地模式 集群模式 本地模式 开启本地模式...严格模式下,必须结合limit来使用) Sort By - 对于单个reduce的数据进行排序(这样最后的数据有可能排序结果不准!!!!)...= true; (该参数为true时,Hive自动对左边的表统计量,如果是小表就加入内存,即对小表使用Map join)(默认左边的加载到内存中去) 相关配置参数: hive.mapjoin.smalltable.filesize...sum,count时使用) 通过设置以下参数开启在Map端的聚合: set hive.map.aggr=true; 相关配置参数: hive.groupby.mapaggr.checkinterval...若聚合之后的数据量/100000的值大于该配置0.5,则不会聚合) hive.map.aggr.hash.percentmemory: map端聚合使用的内存的最大值 hive.map.aggr.hash.force.flush.memory.threshold

    3.9K11

    如何使用StreamSets从MySQL增量更新数据到Hive

    温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。...StreamSets》,通过StreamSets实现数据采集,在实际生产中需要实时捕获MySQL、Oracle等其他数据源的变化数据(简称CDC)将变化数据实时的写入大数据平台的Hive、HDFS、HBase...本篇文章主要介绍如何使用使用StreamSets通过JDBC的方式实时抽取增量数据到Hive。 StreamSets实现的流程如下: ?...去HUE 页面查看hive 表中的数据,发现已经更新进来 ? 4.Pipeline流程测试 ---- 1.去mysql 中增加数据并查看 ? 查看管道流信息发现输入输出数量变成了4 ?...去HUE 中查看hive 表的数据,跟mysql 中同步,说明增量更新成功 ?

    15.7K130

    hive基本使用

    由于最近项目需要和大数据对接,需要了解一下数仓的基本知识,所以记录一下hive的基础原理和使用 hive简介 Hive是一种用类SQL语句来协助读写、管理那些存储在分布式存储系统上大数据集的数据仓库软件...MySQL这种关系型数据库上的,Hive和MySQL之间通过MetaStore服务交互 元数据项 说明 Owner 库、表的所属者 LastAccessTime 最后修改时间 Table Type 表类型...进行交互,使用的比较多 Hive基本数据类型 Hive支持关系型数据中大多数基本数据类型,同时Hive中也有特有的三种复杂类型。...创建分区表 Hive查询一般是扫描整个目录,但是有时候我们关心的数据只是集中在某一部分数据上,比如我们一个Hive查询,往往是只是查询某一天的数据,这样的情况下,可以使用分区表来优化,一天是一个分区,查询时候...#### 排序 ##### Order By order by 的使用与mysql一样,对查询结果进行全局排序,但是Hive语句会放在Hadoop集群中进行MapReduce,如果数据集过大Reduce

    1.2K20

    2021年大数据Hive(二):Hive的三种安装模式和MySQL搭配使用

    Hive的三种安装模式和MySQL搭配使用 一、Hive的安装方式  hive的安装一共有三种方式:内嵌模式、本地模式、远程模式 元数据服务(metastore)作用是:客户端连接metastore服务...解压hive安装包  bin/hive 启动即可使用 缺点:不同路径启动hive,每一个hive拥有一套自己的元数据,无法共享。...二、Hive的安装 我们在此处选择第三台机器node3作为我们hive的安装机器,安装方式使用远程方式。.../dist/hive/ 2、下载mysql的安装包,我们使用的mysql版本是5.7.29,软件包为:mysql-5.7.29-linux-glibc2.12-x86_64.tar.gz  下载地址:https...-5.7.29-linux-glibc2.12-x86_64.tar.gz上传到/export/software目录 2、安装mysql数据库 在这里,我们使用mysql数据库作为Hive的元数据存储,

    4.4K31

    hive建表语句转mysql

    (255), emp_dept VARCHAR(255), emp_salary DOUBLE);转换说明在MySQL中,字符串类型一般使用VARCHAR,并且需要指定长度。...Hive中的表存储格式为TEXTFILE,而MySQL的存储格式由数据库引擎决定,这里假设使用默认的InnoDB引擎。...可以使用DESCRIBE 命令查看表结构信息。步骤二:创建目标存储表结构根据目标存储或数据仓库系统的要求,创建对应的表结构。...步骤三:导出Hive表数据使用Hive的数据导出工具(如Sqoop)或编写脚本来导出Hive表中的数据。可以选择将数据导出为文本文件、Parquet文件等格式。...比如在MySQL中,可以使用MySQL的LOAD DATA INFILE命令或编写脚本来实现数据导入。步骤五:验证数据和表结构在数据导入完成后,务必验证目标系统中表结构和数据的正确性。

    1.2K10

    MySQL数据导入Hive-Java

    文章来源:http://www.study-java.cn/ 上一篇文章我们使用通过beeline执行一些常规的HQL,今天这一篇文章主要来看如果通过Java将MySQL数据导入到Hive中。...Sqoop Sqoop并不在这篇文章的范围内,拿出来说的原因是,公司数据研发部门是通过Sqoop将数据库数据导入到Hive中,其原理是将数据库数据导入到HDFS中临时存储, 然后在将文件导入到Hive中...而笔者并没有采用这种方式,原因很简单,我的目的是学习Hive,过多的用这些工具会增加了我的学习工具成本,所以我看了Sqoop的原理后,准备模仿一下,简单的 实现数据的导入,过程如下: 连接MySQL 查询导入的数据...调用Hadoop的API将数据存入到HDFS中 将HDFS文件导入到Hive中 查询MySQL数据 这里我查询用户表的用户名称,年,月,日,并将结果集存入ResultSet中 String...driverclass = "com.mysql.jdbc.Driver"; String url = "jdbc:mysql://IP:3306/xcxvt?

    2.6K20

    使用Docker部署Django + MySQL + Hadoop + Hive + Vue项目的完整指南

    使用Docker部署Django + MySQL + Hadoop + Hive + Vue项目的完整指南 在现代软件开发中,微服务架构和容器化技术已经成为主流。...本文将详细介绍如何使用Docker部署一个包含Django、MySQL、Hadoop、Hive和Vue的全栈项目。 1....项目概述 我们的项目是一个数据分析和可视化平台,前端使用Vue.js构建用户界面,后端使用Django处理业务逻辑,MySQL作为关系型数据库,Hadoop用于大数据存储和处理,Hive用于数据仓库和查询...在mysql/Dockerfile中,我们定义如何构建MySQL数据库的Docker镜像: # 使用官方的MySQL镜像作为基础镜像 FROM mysql:5.7 # 设置环境变量 ENV MYSQL_ROOT_PASSWORD.../hadoop-config/ $HADOOP_HOME/etc/hadoop/ 4.5 Hive 在hive/Dockerfile中,我们定义如何构建Hive的Docker镜像: # 使用官方的Hive

    45811
    领券