Scala -特定格式的GroupBy列

、、

Transfer | +---------+-------------------+val df = DF1.groupBy如果有其他更好的方法来做同样的事情，我对此持开放态度。提前谢谢你

浏览 1提问于2018-08-30得票数 0

回答已采纳

1回答

聚合星体数据并根据数组类型列中是否存在值进行计数

、

我有一个带有数组类型列的星星之火数据格式：root | |-- element: string (containsNull = true)现在，我需要通过"id“聚合此数据，并根据数组中是否存在特定值进行计数我想这么做： val aggdata = mydf.groupBy<

浏览 0提问于2019-01-31得票数 1

回答已采纳

3回答

在Scala中，x=> x._1._1意味着什么？

._1表示元组的第一个元素，但我不能理解x._1._1表示什么。 val a = b.groupBy(x=> x._1._1)

浏览 0提问于2017-09-21得票数 1

2回答

查找具有不同值的列

、、

我的dataframe有120个columns.Suppose，我的dataframe有下面的结构a 10 1983 19a 10 1983 21b 10 1984 2 我们可以在这里看到id a，value1有不同的值我必须为特定的id找到具有不同值的列。是否有任何统计或其他方法来解决这个问题

浏览 2提问于2016-09-19得票数 0

回答已采纳

2回答

火花数据集:数据转换

、、

我有一个格式的星火数据集-|name |type |cost ||CCCCCCCCCCCCCC|ZZZZZ |1.00|我想把它转换成一个类型的对象public class CostPerName { private Ma

浏览 0提问于2020-06-10得票数 1

回答已采纳

2回答

星火中多轴柱的改名与优化

、、、

我的输入数据中有一组列，我将基于多个列进行旋转。由我的方法生成的输出-预期输出头：到目前为止为了达到我想要的结果所做的步骤- scala>= filtered_data.groupBy("salar

浏览 0提问于2018-03-14得票数 1

回答已采纳

0回答

根据spark scala中输入的字符串date过滤数据帧

、、、

我有一个表，其中有一列' date‘，日期格式为yyyyMMdd。我需要过滤这个dataframe，并返回一个只包含日期大于输入的行的dataframe，例如: return the all rows where date is greater "20180715“。scala> df.groupBy("date").count.show(50,false) scala

浏览 7提问于2018-07-19得票数 0

回答已采纳

1回答

minBy等价于Spark

、、

我正在寻找minBy聚合在Spark中的等效功能，或者可能需要手动聚合。有什么想法吗？谢谢。

浏览 2提问于2018-07-25得票数 2

1回答

用scala中的varargs创建groupBy函数

、

我试图为scala中的groupBy单列或多列创建以下函数。".desc).show()但是这个代码错误的地方是： (col1: String,cols似乎正在编译以下方法： def groupBy(col1: String, cols: String*): Relatio

浏览 2提问于2020-12-04得票数 0

回答已采纳

2回答

SparkSQL -在联接和groupBy之后获得重复行

、、

我有两个列的数据格式，如下所示。 .join(df2, "uid") .agg(count("*") as "xcnt", sum("s

浏览 0提问于2018-01-27得票数 3

回答已采纳

2回答

在Apache Spark中解析/查询异构CSV数据的最佳方法？

、

我有大量的日志数据，这些数据是半结构化的CSV数据。但是，每一行的列取决于它是什么类型的行，由特定的列指示。03/2018, dog, Bella, 9, 18/07/2018, dog, Scout, 5, 3 此特定示例显示了一个半结构化文件lastName: String, age: I

浏览 1提问于2018-08-22得票数 1

1回答

如何使用嵌套元素将数据集从CSV转换为JSON？

、、

但我不知道如何用通缉的方式将数据组织起来。groupBy函数返回一个不能保存为json的RelationalGroupedDataset。sql查询希望在分组后使用聚合。我很感谢你的帮助。

浏览 2提问于2017-12-15得票数 0

回答已采纳

2回答

为什么$不能处理String类型的值(并且只直接处理字符串文本)？

、、

" val Date = "Date"}userJobBehaviourDF.groupBy($(ColumnNames.JobSeekerID))userJobBehaviourDF.groupBy(

浏览 2提问于2018-01-11得票数 2

回答已采纳

2回答

当RDD[(String，Int)]上的saveAsTextFile时，如何删除记录周围的括号？

、、

我的代码：words: Array[String] = Array(HI, HOW, ARE) scalakeyvalueR

浏览 6提问于2016-12-30得票数 4

回答已采纳

2回答

pyspark中的月度聚合

、、、

我正在寻找一种按月聚合我的数据的方法。我想首先在我的访问日期中只保留一个月。我的DataFrame看起来像这样：patientid = P1_Pt1959, note = jnut, |26/03/2015| 18560.0| |14&

浏览 2提问于2018-09-29得票数 3

2回答

如何使用Dataset API (如SQL的“按1分组”或“按2排序”)使用序数？

、、

我能够在Spark‘文字’查询中使用序数(在GROUP BY和ORDER BY之后的这些整数)：但是对于DataFrames/DataSet，我必须始终使用列名： df.select($"ProfileName").groupBy($"ProfileName").count().orderBy(desc("count&

浏览 3提问于2017-07-19得票数 2

回答已采纳

3回答

星星之火将多个列作为字符串聚合为一列

、、、

udp: 5523, igmp: 4423, egp: 2331} |聚合列可以是列表或映射对于DataFrame函数，这是可能的吗?还是我需要创建自己的udf来聚合它呢？

浏览 1提问于2018-05-17得票数 0

回答已采纳

1回答

"df['var'].map(df2)“和"df.var.map(df2)”总是产生相同的结果吗？

、、

我有一个带有列df的dataframe df2，还有一个带有var和var2列的dataframe df2。两个数据格式中的两个列var完全相同。在我的示例中，df['var'].map(df2)和df.var.map(df2)得到了相同的结果。我想问一下，这是否只是我的特定数据集中的巧合，还是总是如此。非常感谢!更新：在我的示例中，下面的代

浏览 2提问于2021-03-20得票数 1

回答已采纳

1回答

如何使用pivot生成单行矩阵？

、

我需要将以下两列数据帧转换为单行数据帧(从长到宽)。20090622| 458||20090626| 151||20090914| 453|我需要这样的格式-------+----------+----------+我运行了以下代码： result_df.groupBy($"udate").p

浏览 2提问于2016-11-02得票数 1

2回答

Scala:如何根据元组的第一个元素合并列表

假设我有一份清单：我怎样才能把这份清单写成：只有一个功能？

浏览 1提问于2017-03-18得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

聚合星体数据并根据数组类型列中是否存在值进行计数

在Scala中，x=> x._1._1意味着什么？

查找具有不同值的列

火花数据集:数据转换

星火中多轴柱的改名与优化

根据spark scala中输入的字符串date过滤数据帧

minBy等价于Spark

用scala中的varargs创建groupBy函数

SparkSQL -在联接和groupBy之后获得重复行

在Apache Spark中解析/查询异构CSV数据的最佳方法？

如何使用嵌套元素将数据集从CSV转换为JSON？

为什么$不能处理String类型的值(并且只直接处理字符串文本)？

当RDD[(String，Int)]上的saveAsTextFile时，如何删除记录周围的括号？

pyspark中的月度聚合

如何使用Dataset API (如SQL的“按1分组”或“按2排序”)使用序数？

星星之火将多个列作为字符串聚合为一列

"df['var'].map(df2)“和"df.var.map(df2)”总是产生相同的结果吗？

如何使用pivot生成单行矩阵？

Scala:如何根据元组的第一个元素合并列表

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐