腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1514)
视频
沙龙
1
回答
Scala
Spark
数组
()
vs
collect_list
()
、
在
spark
中使用
scala
的
collect_list
()和array()有什么不同? 我看到到处都是用法,但用例并不清楚,我无法确定其中的区别。
浏览 15
提问于2019-04-24
得票数 2
回答已采纳
1
回答
如何将列从dataframe中获取到一个列表中
、
我有一个大约有80列的DataFrame,我需要将其中的12列放到一个集合中,无论是Array还是List都行。我做了一点谷歌,发现了这个:问题是,这适用于一列。如果我做了df.select(col1,col2,col3...).rdd.map.collect(),那么它就给了我这样的东西:Array[[col1,col2,col3]]。提前谢谢。
浏览 4
提问于2017-07-24
得票数 0
回答已采纳
1
回答
星星之火: java.lang.IllegalArgumentException:需求失败的kmeans (mllib)
、
、
import
scala
.collection._import org.apache.
spark
.sql.functions.udf$.require(Predef.
scala
:212)
浏览 0
提问于2018-05-20
得票数 1
1
回答
如何获得使用concat_ws生成的结果的大小?
、
、
这是我的密码: .concat_ws(",",org.apache.
spark
.sql.functions.collect_list
浏览 3
提问于2017-11-27
得票数 2
回答已采纳
2
回答
在用Nulls维护架构的同时激发GroupBy
、
、
、
、
我对
Spark
和
Scala
相当陌生,我只能以一种过程的方式构建我的想法,在A上遍历每一行并散列,并以这种方式构建一个完整的行,但我不相信它是一个干净的解决方案,也无法使用
spark
有效地表达它。
浏览 0
提问于2018-03-27
得票数 0
回答已采纳
1
回答
Spark
2将
scala
数组
转换为WrappedArray
、
当我将
数组
传递给function时,
Spark
2会自动将
scala
数组
转换为WrappedArray。然而,在
Spark
1.6中,
数组
被转换为类似'a,b,c‘的字符串。,$"b",$"c") .groupBy($"a&
浏览 38
提问于2020-10-05
得票数 0
回答已采纳
1
回答
如何将WrappedArray转换为
Spark
Scala
中的列表?
、
、
、
、
我使用DataFrame来处理
spark
中的数据。我在这个数据帧中有一个
数组
列。在我要做的所有转换的最后,我得到了一个包含一个
数组
列和一行的dataframe。为了应用groupby、map和reduce,我想把这个
数组
作为一个列表,但我做不到。("WordsArray")) .withColumn("FlattenWords", flatten($"
collect_list
(WordsArray)")).
浏览 33
提问于2021-04-11
得票数 0
2
回答
从列中获取值并创建另一列
、
、
、
、
我正在使用
Spark
,并在一个Hive表上执行一些SQL操作。
浏览 1
提问于2018-11-27
得票数 0
回答已采纳
1
回答
如何在
spark
-sql中连接指定大小有限的
数组
中的多行
、
如何在
spark
-sql中将多行聚合到有限大小的
数组
中。 我尝试过使用聚合函数,但无法帮助指定
数组
的大小。
浏览 29
提问于2021-09-19
得票数 2
1
回答
如何将火花数据映射转换为JSON映射?
、
"abc","234"我试图将数据格式化为JSON映射:我创建了一个数据框架,然后使用_list/
spark
对名称和收集数字进行分组,但我无法获得字符串中的引号,我也不知道如何将其格式化为JSON映射:
scala
> val df =
spark
.r
浏览 5
提问于2022-09-13
得票数 1
2
回答
Apache
Spark
SQL查询和DataFrame作为参考数据
、
、
我有两个
Spark
DataFrames: 包含以下列的cities DataFrame: cityLondon var resultDf =
spark
.sql
浏览 11
提问于2019-01-21
得票数 1
回答已采纳
1
回答
如何在执行DataFrame操作后从
spark
GroupBy列收集字符串列表?
、
、
我正在使用
Spark
1.6并尝试使用 线程"main“org.apache.
spark
.sql.AnalysisException中的异常:未定义函数
collect_list
;at org.apache.
spark
.sql.catalyst.analysis.SimpleFunctionRegistry$$anonfun$2.apply(
浏览 2
提问于2016-02-10
得票数 5
回答已采纳
1
回答
星星之火- java.lang.OutOfMemoryError:请求的
数组
大小超过VM限制
、
:377) at org.apache.
spark
.shuffle.sort.UnsafeShuffleWriter.write(UnsafeShuffleWriter.java:166)
浏览 0
提问于2018-05-02
得票数 2
2
回答
Scala
/
Spark
-如何获取所有子
数组
的第一个元素
、
、
我在
Spark
中有以下DataFrame (我正在使用
Scala
):我是
Scala
的新手,找不到合适的匿名map函数。提前感谢您的帮助
浏览 1
提问于2019-12-09
得票数 1
回答已采纳
2
回答
如何在
Spark
1.6的窗口聚合中使用collect_set和
collect_list
函数?
、
、
、
在
Spark
1.6.0 /
Scala
中,有没有机会获得
collect_list
("colC")或collect_set("colC").over(Window.partitionBy("colA")
浏览 2
提问于2017-07-17
得票数 14
2
回答
按键到列表中触发DataFrame聚合列值
、
、
我有一个看起来像这样的DataFrame:|Id | value || 1622| 139685|| 1622| 127955|| 1622| 727761|| 3837|1504923
浏览 1
提问于2016-05-25
得票数 13
回答已采纳
1
回答
Spark
GroupBy agg
collect_list
多列
、
、
例如:+---+-----+----+-----++---+-----+----+-----+combList: List[String] = List(event, date, place)
scala
> val v = w.groupBy("iid").
浏览 2
提问于2018-02-13
得票数 9
2
回答
Spark
SQL -从sql函数生成
数组
的
数组
、
、
我想创建一个
数组
数组
。sqlContext.createDataFrame(x) df.registerTempTable("df")sqlContext.sql("SELECT
collect_list
(age) as age from df&qu
浏览 2
提问于2016-03-22
得票数 5
回答已采纳
1
回答
星星之火--选择和所有已连接数据集的列
、
、
我有两个表雇员(Id,姓名),EmployeeSalary (EmployeeId,指定,工资)。一名员工可以在公司中持有多个职务,并具有多个薪资。我如何得到EmployeeId,名字,工资的总和,所有指定的塞克。 employeeDS.join(employeeSalaryDS, employeeDS.col("Id").groupBy(employeeDS.col("Id")).
浏览 1
提问于2018-10-05
得票数 0
回答已采纳
1
回答
在
Spark
中,根据映射表,有没有办法将字符串
数组
转换为相应的整数
数组
、
、
在
Spark
中,根据映射表(String -> Integer),有没有办法将字符串
数组
转换为相应的整数
数组
?例如:在
Spark
中,有5亿个
数组
, Array String 1 : ['TOM','White','Black'] Array String 2 : ['BCD','TTTT','Black']
浏览 25
提问于2019-09-02
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Scala快速入门-3-常用数组操作
走进大数据 Spark Streaming VS Flink
Apache Spark框架下,Python与Scala谁更胜一筹?
Spark 2.4重磅发布:优化深度学习框架集成,提供更灵活的流式接收器
加米谷大数据:大数据开发需要学习哪些技术?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券