腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
来自
多个
列
的
“
Hive
”
最大
列
值
、
、
您好:我有一个情况,我需要找到3个计算字段
的
最大
值
,并将其存储在另一个字段中,是否可以在一个SQL查询中完成?Income3 * 1% as Job_Income , From Table then Share_income Else Job_income as the greatest_inc
浏览 1
提问于2018-09-06
得票数 1
回答已采纳
1
回答
如何设置动态分区,其中
列
键将是分区
、
、
、
、
所以我有一个表A和表B,其中表A数据是从表B中插入
的
。本质上,表A和表B是相同
的
,唯一
的
区别是表A有一个date_partition
列
,而表B没有。表B模式是: ID int school_bg_dt bigint log_on_count int active_count int date_partition字符串set
hive
.exec.dynamic.partition=true; set
hive</em
浏览 3
提问于2016-10-28
得票数 0
回答已采纳
1
回答
1个平面文件,不同
的
架构取决于
值
、
如果我有一个平面文件,并且
列
数随输入字段而变化,A,0,00,01,AlexA,2,22,02,Paul这里A有4个字段(id,number,rank,name),B现在,存储此数据
的
最佳方式是什么(
Hive
或Hbase)。因为我需要查询数据以进行分析。还能让我知道最好
的
方法吗? 另外,可以根据第一个字段
的
输入创建Avro模式吗?请帮帮我..
浏览 4
提问于2018-08-23
得票数 0
回答已采纳
1
回答
配置单元在计算功能组时如何定义组(
最大
,最小..)当在同一行中使用标量数据时?
、
、
在
Hive
中,使用如下语句: MIN('Foo') as name;+------------+---------------+---------++------------+---------+FOO, Foo ( Max('FOO')是一组1
的
最大
值
,Max('Foo')是另一组1<em
浏览 1
提问于2015-12-04
得票数 2
1
回答
从
HIVE
表中获取最新
的
分区
、
、
、
我希望加载脚本,并将年份、月、日合并为单个
列
,并获取
最大
值
。Load year,month,date from
HIVE
.`abc`.`abc1'; 通过这样做,我将得到作为2020_5_21
的
结果。但是我应该用分隔符找到日期
的
最大
值
。发生以下错误:连接器应答错误: SQL##f - SqlState: S1000,ErrorCode: 35,ErrorMsg: Cloudera (35)
来自
服务器
的</
浏览 9
提问于2021-05-11
得票数 1
回答已采纳
1
回答
如何让雅典娜/普雷斯托识别拼花指数?
、
、
、
、
我有一个25k
的
“行”拼花文件(总计469.5kb),其中每个项目都有一个唯一
的
整数id。知道了这一点,我在本专栏上添加了一个索引,但没有显示索引该
列
在使用Athena (AWS服务)/ Presto (基础引擎)时实际上会影响性能。我正在尝试一个简单
的
选择,从哪里我要拉一个行,它是id-FROM widgets wid
列
是索引
的
,所以一旦Presto找到匹配项,就不应该再进行任何扫描
列
也是有序
的</
浏览 0
提问于2018-09-24
得票数 2
回答已采纳
2
回答
Hive
中是否有字符串数据类型
的
最大
大小?
、
、
或者,这是否意味着只要集群被允许,
Hive
就可以支持任意大字符串数据类型?如果是这样,我在哪里可以找到我
的
集群可以支持
的
字符串数据类型
的
最大
大小? 提前感谢!
浏览 1
提问于2016-01-27
得票数 15
回答已采纳
2
回答
如何从具有组
的
表中找到
最大
值
、
、
我有下面的表(播放器)
列
此表包含所有球队
的
所有球员信息。PlayerID是主
列
。每个团队包括
多个
球员,因此在teamId上有许多重复
的
值
。得分是每个球员
的
得分。select max(score) score, teamId from player group by teamId 此查询工作良好
浏览 0
提问于2017-05-03
得票数 0
回答已采纳
2
回答
通过ddply或其他R函数进行多级聚合(如“分组集”)?
、
我希望能够通过
多个
列
进行聚合,获得
的
结果不仅是最好
的
聚合(每个分组
列
中有一个
值
),而且还可以获得更高级别的聚合(
来自
一个分组
列
的
一个
值
,对其他分组
列
没有限制,等等)。我相信Oracle和
Hive
可以通过“分组集”(也是
Hive
中
的
“多维数据集”和“汇总”)来实现这一点。rbind.fill(ddp
浏览 5
提问于2014-01-26
得票数 4
回答已采纳
2
回答
如何从
Hive
Hue中排除零
的
7
列
中获取最小
值
和
最大
值
、
、
、
我有一个有9
列
的
表格。下面是它
的
结构 ? 我需要一行中不包括零
的
列
的
最小和
最大
值
。下面是所需
的
表结构 ? 如果您看到
列
min和max,则min是不包括零
的
特定行中7个cols (col1到col7)
的
最小
值
,max是该行7个cols (col1到col7)中
的
最大
值
。请帮助我在
hive</
浏览 60
提问于2021-04-03
得票数 0
回答已采纳
1
回答
如何获得仅在单元格中具有空
值
的
所有
列
的
列表?
、
、
、
我正在处理一个巨大
的
数据集,在
Hive
中有超过10k行和600
多个
列
。有
多个
行列,对所有行都具有NULL
值
。如何获得只有NULL
值
的
所有
列
的
列表?
浏览 1
提问于2020-08-05
得票数 3
回答已采纳
2
回答
配置单元在特定数字后自动递增
我需要在一个目标表中插入数据,其中除了代理键
列
之外,所有
列
都应该从不同
的
源表中填充;该
列
应该是目标表
的
最大
值
加上从1开始
的
自动增量值。我可以使用row_number()函数生成自动增量值,但在同一查询中,我应该如何从目标表中获取代理键
的
最大
值
。在
HIVE
中有没有什么概念,我可以选择代理键
的
最大
值
,并将其保存在临时变量中?或者,有
浏览 0
提问于2016-08-15
得票数 9
回答已采纳
1
回答
从表模式处理看
Hive
和Parquet之间
的
火花-主键差异
、
我是新来
的
火花和蜂巢。我不明白这句话如果有人用例子来解释这句话,那对我会更好。谢谢你。
浏览 1
提问于2016-12-10
得票数 1
2
回答
配置单元:如何拥有存储
来自
情感分析API
的
情感
值
的
派生
列
、
、
以下是场景:假设它有5
列
。一
列
是文本数据。现在,如何添加存储
来自
twitter文本数据
的
sentiment Analysis
的
情感
值
的
第6
列
。我计划使用情感分析应用程序接口,如Sentiment140或viralheat。我非常感谢任何关于如何在
Hive
中实现“派生”
列
的
技巧。 谢谢。
浏览 1
提问于2012-11-17
得票数 2
回答已采纳
2
回答
Hadoop
Hive
双类型问题
、
新用户
的
Quick
Hive
/Hadoop问题。
浏览 1
提问于2011-09-03
得票数 0
回答已采纳
3
回答
动态分区和插入特定
列
、
、
有一个包含大约100
列
的
HIVE
表,按
列
ClientNumber和Date进行分区。我正在尝试将
来自
另一个
HIVE
表
的
数据插入到仅30
列
中,并动态创建Date分区。问题是所有数据都会加载到"ClientNumber=123/date=__
HIVE
_DEFAULT_PARTITION__“分区中,这并不是我们所期望
的
。
值
都是正确
的
,没有空
值
或其他
浏览 2
提问于2016-11-21
得票数 0
2
回答
Hbase shell:如何基于特定
的
多个
列
值
扫描行
Hbase新手,没有配置
hive
或impala。:-(现在想要基于
多个
列
值
扫描表
的
行,比方说具有4
列
aa、ab、ac、ad
的
表A。我想要表中满足
列
ab & ad
的
值
条件
的
所有行。另一种查询是如何在
多个
表上查询,假设表中存在外键。
浏览 0
提问于2014-08-08
得票数 0
2
回答
是否可以更改默认
的
单元分区
值
?
、
、
、
当我们在AWS S3中拥有分区
列
的
空数据
的
记录时,
Hive
默认给出它们
的
分区
值
为: 这会导致问题,因为我们
的
分区
列
是一个整数,但这是一个字符串
值
有没有一个我们可以利用
的
设置来给它一个整数默认
值
?
浏览 0
提问于2020-03-20
得票数 1
2
回答
如果列为空,如何在配置单元中获取不同
的
行
、
、
、
、
我使用
hive
生成我
的
输出,并尝试在我
的
输出中获得不同
的
行。C1 C2 C3 C4 在这里,
列
C3是空白
的
,并且期望
的
输出只是其中
的
一
列
。如果有人以前遇到过这个问题,请帮助我,
浏览 0
提问于2016-06-07
得票数 0
1
回答
PySpark-如何使用Pyspark计算每个字段
的
最小、
最大
值
?
、
、
、
、
我正在尝试找出sql语句产生
的
每个字段
的
最小
值
和
最大
值
,并将其写入csv文件。我试着在下面的时尚中得到结果。你能帮帮我吗。mean, stddevsc =SparkContext()
hive
_context= HiveContext(sc) #bank =
hive
_context.table("cip_utilitie
浏览 2
提问于2018-11-20
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
010 如何从列中找到需要的值
利用Python实现表格中指定列的值替换
使用pandas筛选出指定列值所对应的行
【Excel】提取一列中的不重复值函数
【Excel】提取一列中的唯一值函数
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券