首页
学习
活动
专区
圈层
工具
发布

#hive

Apache Hive是一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼,查询和分析。

hive两个表不同数据类型字段关联引发的数据倾斜

用户4128047

关联字段可无损转换时(如int转string)  2.添加随机数分散Key‌ 对倾斜字段添加随机后缀再关联

10010

hive字段关键字问题处理

用户4128047

        最近在xxl_job部署shell调度任务时,发现在编写Hql时,对一些使用关键字命名的字段无法解析,按开发规范,字段命名不应该有关键字,但是数...

11210

HIVE-17824,删除hdfs分区信息,清理metastore元数据

用户4128047

        当手动删除HDFS 分区数据时,但是并没有清理 Hive 中的分区元数据,删除操作无法自动更新hive分区表元数据。也就是从hdfs中删除大量分...

13210

spark集成hive

用户4128047

        集群使用ambari+hdp方式进行部署,集群的相关版本号如下所示:

11310

hive往es映射表写数据报错

用户4128047

hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。...

7510

记录一次hive无法删除异常分区问题

用户4128047

今天在做数据导入时,发现有几个异常分区。因为异常分区影响到BI端数据报表展示。所以需要删除;

6600

hive排序

用户4128047

1.全局排序(Order By) Order By:全局排序,一个Reducer ASC(ascend):升序(默认) DESC(descend):降序 ...

11600

连接谓词中不支持or

用户4128047

9110

笛卡尔积

用户4128047

1.产生条件 (1)省略连接条件 (2)连接条件无效 (3)所有表中的所有行相互连接 案例实操

7510

多表连接查询

用户4128047

大多数情况下,Hive 会对每对 JOIN 连接对象启动一个 MapReduce 任务。本例中会首先启动一个 MapReduce job 对表 e 和表 d 进...

10610

hive导入/导出实操案例

用户4128047

6.清除表中数据(Truncate) 注意:Truncate 只能删除管理表,不能删除外部表中数据

15410

Hive数据类型

用户4128047

对于 Hive 的 String 类型相当于数据库的 varchar 类型,该类型是一个可变的字符串,不过它不能声明其中最多能存储多少个字符,理论上它可以存...

13210

Hive常见属性配置

用户4128047

2.查询后信息显示配置 1)在 hive-site.xml 文件中添加如下配置信息,就可以实现显示当前数据库,以及查询 表的头信息配置。

13610

Hive常用交互命令

用户4128047

3.查看在 hive 中输入的所有历史命令 (1)进入到当前用户的根目录/root 或/home/hadoop (2)查看. hivehistory 文件

9410

启动 hive产生 java.sql.SQLException 异常问题

用户4128047

Exception in thread “main” java.lang.RuntimeException: java.lang.RuntimeExcepti...

12010

Hive 和数据库区别

用户4128047

1.由于 Hive 采用了类似 SQL 的查询语言 HQL(Hive Query Language),因此很容易将 Hive 理解为数据库。其实从结构上来看,H...

11410

修改表及实操案例

用户4128047

注:ADD 是代表新增一字段,字段位置在所有列后面(partition 列前),REPLACE 则是表示替换表中所有字段。 (2)实操案例 (1)添加列

7810

分区表及实战

用户4128047

概念:分区表实际上就是对应一个 HDFS 文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive 中的分区就是分目录,把一个大的数据集根据业务需要...

12100

Hive参数设置

用户4128047

设置为mr则调用Hadoop的mr执行;设置执行引擎为spark则调用spark执行任务。若有条件设置为Spark,因为运行比Hadoop的mr快。 2.启动...

14510

hive like关键词模糊匹配

用户4128047

或者类似其他的我们可以直接%你要匹配的字段% 但是在hive里面不行,因为转义了,需要自定义UDF去完成这个操作!

10010
领券