腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
具有
多
列
的
Hive
-
collect_list
?
、
假设我
的
表是这样
的
:Jon,English,80Matt,English,90Jon,History,60有没有办法使用
collect_list
,这样我就可以得到我
的
查询:Amy: Geography:70; French:90编辑: 这里
的
复杂之处在于,<em
浏览 5
提问于2018-02-07
得票数 3
回答已采纳
3
回答
如何在groupBy之后聚合映射
列
?
、
、
我需要联合两个数据帧,并通过键组合
列
。这两个datafrmae
具有
相同
的
模式,例如:|-- id: String (nullable = true)| |-我尝试了下面的代码:rdd.map(x似乎不能用来映射结构: or
浏览 0
提问于2017-05-29
得票数 2
回答已采纳
1
回答
在apache spark中,如何在groupBy()之后将mllib Vector
列
收集到一个列表中?
、
、
、
我有一个数据帧,其中一
列
包含一个mllib.linalg.Vector。我希望将数据帧中
的
另一
列
(例如ID
列
) groupBy,并将特征向量"
collect_list
“到列表中。我得到了下面的错误。这是一个泛型操作,为什么它关心
列
中数据
的
类型?它适用于标量数字或字符串等,但似乎不适用于mllib Vector。有没有解决这个问题
的
办法?,也许是
collect_list
()之外
的
另一个函数?No handle
浏览 13
提问于2017-01-12
得票数 2
回答已采纳
1
回答
需要从配置单元UDF中
的
3
列
构建3个列表
、
、
我在编写
HIVE
UDF时遇到了麻烦,在这里我将3个参数作为3
列
传递给UDF。我需要用
列
值构建3个列表。在此基础上,我将在3个列表上执行逻辑,并为每条记录返回一个字符串。我
的
代码必须看起来像这样。
浏览 0
提问于2014-12-27
得票数 0
2
回答
bigquery中
的
查询单元
、
、
我想要计算一个新
的
列
c1,即collect_set
的
类型,然后连接collect_set
的
结果,最后从结果中删除转义。在
Hive
中,查询是: select distinct numcat,numpl,numcr, natcat, cdvign, translate(concat_ws('!',
collect_list
(cast(typpl as string)) over(partition by numcat,numpl,numcr, natcat, cdvign)
浏览 2
提问于2020-10-28
得票数 2
回答已采纳
2
回答
在配置单元中使用"
Collect_List
()“函数时出错
、
、
、
每当我在配置单元上运行函数"
collect_list
“时,它总是抛出一个错误:Total jobs = 1Failedto get session数据:1 A2 C我在
hive<
浏览 5
提问于2017-04-21
得票数 0
1
回答
如何知道我用
的
是哪种蜂巢?
、
、
我刚开始运行
Hive
查询。在堆栈溢出上有一个答案表明,基于我正在使用
的
Hadoop版本,这样做是有限制
的
。 如何根据Group查询将所有行连接到一个单独
的
逗号分隔字段?
浏览 3
提问于2015-03-06
得票数 1
回答已采纳
1
回答
PySpark -未定义
的
函数
collect_list
、
、
、
我使用
的
是Python 2.6.6和Spark 1.6.0。我
的
df是这样
的
: id | name | number |1 | joe | 148590 | 2 | bob('name'))
的
程序时,我都会得到以下错误pyspark.sql.utils.AnalysisException: u'undefined function
collect_list
;'为什么会这样我还尝试
浏览 62
提问于2020-07-02
得票数 1
回答已采纳
1
回答
在PySpark 1.5.0中,如何根据‘x’
列
的
值列出‘y’
列
的
所有项?
、
、
以下问题是针对PySpark版本1.5.0
的
,因为PySpark中不断添加新特性。| x| y||foo| 1||bar| 10||qux|999|我想要这样
的
东西在潘达斯,我可以通过以下方式来实现这个星座:pd.groupby('x')['y'].appl
浏览 4
提问于2016-03-20
得票数 1
回答已采纳
1
回答
按特定顺序为每个唯一ID连接多个字符串行
、
、
、
、
我想要创建一个表,其中每一行都是唯一
的
ID,places
列
由一个人访问
的
所有地点和城市组成,按访问日期排序,使用Pyspark或
Hive
。另外,对于每一
列
,我需要继续单独执行这个步骤。我还尝试使用windows函数,如本文()所述,但它控制了一个错误:java.lang.UnsupportedOperationException:窗口操作中不支持'
collect_list
(')。我想: 1-按旅行日期
的
先后顺序,命令连接
的
列
浏览 0
提问于2019-06-26
得票数 0
回答已采纳
1
回答
是否可以在蜂巢中连接一个又一个字符串字段?
、
我找到了一个名为"concat_ws“
的
函数,但看起来我必须显式列出要连接
的
所有值。我想知道我是否可以在蜂巢里用concat_ws做这样
的
事情。下面是一个例子。所以我有一个名为"my_table“
的
表,它有两个字段,分别命名为country和city。我现在正在使用来自CDH5
的
Hive
0.11
浏览 4
提问于2015-05-03
得票数 7
回答已采纳
1
回答
计算配置单元中
的
百分位数
、
我
的
HDFS中有大约4 of
的
JSON,我已经使用JSON Serde创建了一个
Hive
表。最终数据预计在25 be左右。所以perCol10中
的
18.42是col10中
的
423相对于整个col10
的
百分位数。以前,我使用NumPy数组在内存中使用(小得多)
的
数据集执行相同<e
浏览 1
提问于2014-08-28
得票数 1
3
回答
配置单元:在查询中将array<string>转换为array<int>
、
、
、
我有两张表:`1` array<string>); `1` array<int>);insert
浏览 0
提问于2015-10-01
得票数 6
1
回答
如何在执行DataFrame操作后从spark GroupBy
列
收集字符串列表?
、
、
描述
的
解决方案(由zero323描述)非常接近于我想要
的
,只需两个曲折: org.apache.spark.sql.functions.collect_list(Column col)如该问题
的
解决方案中所描述
的
,但得到了以下错误 线程"main“org.apache.spark.sql.Analys
浏览 2
提问于2016-02-10
得票数 5
回答已采纳
1
回答
PySpark组由
collect_list
设置在窗口上
我有一个
多
列
的
数据框架。我试图通过窗口函数使用id上
的
collect_list
来聚合几个
列
。我在尝试这样
的
事情:df = df.groupBy(如果您不关心您得到
的
值,则添加到group by或care (或first_value)中 如果我对单个
列</em
浏览 0
提问于2020-06-02
得票数 0
回答已采纳
2
回答
蜂箱连接查询优化
、
、
、
、
Table Acol1, col2,Adate,qty -------表
的
大小如下:请考虑以下查询: A.col1, B.Bdate bdate,FROM A GROUP BY A.col2,上面的蜂巢查询在一个由4个从节点(8GB内存,100 GB磁盘)
浏览 2
提问于2020-04-12
得票数 3
1
回答
存储倒置索引
、
我正在使用Spark创建一个倒置索引(或者更多
的
是一个“发布列表”,所以发布
的
顺序很重要),看起来有点像这样 | key | postings我想知道最好
的
选择是在星火中创建这样
的
数据,并最终将其存储到Parquet。你建议使用嵌套结构吗?或者更确切地说,使用数组来存储帖子(如果我想要存储
的
不仅仅是一个id,而是一个id和一个距离,即整数和浮点数
的
元组),我该怎么办?或者你会建议不要使用这样
的
投递列表,而选择一个扁平
的
结构(例如,在同一键多次
浏览 2
提问于2016-06-07
得票数 0
回答已采纳
1
回答
使用配置单元函数对数据进行排序
15),(2,'c', 12),我希望结果表看起来像这样-1, c->a->bjourney
列
按每个id
的
时间升序排列select id , concat_ws(">",
collect_list
(channel)) as journeygroup by id 但它并不能维持秩序
浏览 2
提问于2018-06-23
得票数 0
2
回答
数组
的
SQL过滤器元素
、
我有一张类似于此
的
员工表:A [{"name":"John", "age":10, "job":"Manager"},{"name":"Eli", "age"":"CEO"},{"name":"Mike", "age":334 "job":"CTO"
浏览 3
提问于2020-06-24
得票数 1
回答已采纳
1
回答
将GROUP_CONCAT按以下顺序排列
、
、
、
我有一张桌子我期望得到这样
的
输出(在一个记录中对结果进行分组,group_concat应该根据值DESC对结果进行排序)。SELECT id,FROM tabl
浏览 1
提问于2018-02-28
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
多行多列转为一列,Word抢Excel的活
全兼容的多列均匀布局问题
多文件夹下Excel指定列的提取合并
前端应该掌握的CSS实现多列等高布局
Excel中将一列分成多列多行的操作技巧,同事分分钟完成了
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券