腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
将
Spark
DataFrame
转
换为
数组
/
映射
/
列表
、
age":30,"name":"Andy"},在Json中,我有一个
DataFrame
| 19| Justin| 54326|我想转换这个
DataFrame
浏览 0
提问于2017-08-23
得票数 0
回答已采纳
1
回答
如何使用相当复杂的架构
映射
数据集?
、
、
,应用
DataFrame
的每个行的自定义函数来满足需求:
dataframe
的每一行都有两个或更多的元素,它们具有我在问题中发布的结构。首先,我希望
将
行
列表
中的每一行元素分开,因为我需要对它们进行比较。其中一个是我想应用另一个
映射
的
DataFrame
[ListRow],因此我可以合并每个
列表
的元素(为此,我编写了一个递归函数,检查
列表
中的顺序,并用旧元素的值填充新元素的空字段)。由于模式相当复杂(至少我不知道如何生成一个StructType,而<em
浏览 2
提问于2017-09-26
得票数 1
回答已采纳
1
回答
如何
将
dataFrame
转
换为
列表
列表
?
、
、
我正在尝试使用
spark
_apply
将
R函数应用于
Spark
DataFrame
。在我最初的问题中,我有一个
列表
列表
,我已经将其转
换为
R数据帧,我将能够将其转
换为
Spark
DataFrame
。但是在我的R函数中,我需要使用一个
列表
列表
,而我不知道如何从数据帧中取回我的初始
列表
列表
。我已经找到了如何
将
dataFrame<
浏览 10
提问于2019-07-05
得票数 2
回答已采纳
2
回答
可以在
Spark
Dataframe
列中存储numpy
数组
吗?
、
、
我有一个
dataframe
,我对它应用了一个函数。此函数返回一个numpy array,代码如下:
dataframe
=
dataframe
.withColumn('vector', create_vector_udf('text')) dmoz_
spark
_df.select('lang','url','v
浏览 4
提问于2017-07-07
得票数 10
2
回答
如何在火花放电中将密集向量的关系式转换成
DataFrame
?
、
、
、
、
0.0, 0.0]), DenseVector([0.0, 1.0, 1.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0])]>>>
spark
.createDataFrame(frequencyDenseVectors, ['rawfeatures']).collect()Traceback_createFromRDD(data.map(prepare), schema, samplingR
浏览 3
提问于2016-12-26
得票数 11
回答已采纳
3
回答
将
JavaRDD转
换为
DataFrame
时的火花错误: java.util.Arrays$ArrayList不是array<string>模式的有效外部类型
、
我正在使用
Spark
2.1.0。对于下面的代码,它读取文本文件并将内容转
换为
DataFrame
,然后输入到Word2Vector模型中:它抛出一个异常 java.lang.RuntimeException:编码时出错: java.util.Arrays$ArrayList不是
数组
模式的有效外部类型不同的是,我正在
将
Ja
浏览 3
提问于2017-04-23
得票数 3
2
回答
如何
将
RDD[CassandraRow]转
换为
DataFrame
?
、
、
、
、
目前,我正在
将
Cassandrarow RDD转
换为
dataframe
:} 正如您所看到的,我首先将cassandraRow rdd转
换为
string,然后
映射
到我想要的格式。
浏览 5
提问于2017-05-30
得票数 0
回答已采纳
2
回答
MongoDB火花冲突数据类型
、
、
如何在
将
Mongodb集合
映射
到
Spark
dataframe
时避免冲突的数据类型。我们不能将冲突的数据类型转
换为
字符串。并在执行select操作时出错。我使用的是Mongodb-
Spark
-connector v2.10:1.0.0
浏览 4
提问于2016-07-21
得票数 0
2
回答
如何筛选出包含其他数据帧中的char序列的行?
、
、
因此,如果df2中的值是df1中的“类似”键,我
将
尝试从df1中删除行。我不确定这是否可行,或者是否需要首先将df1更改为
列表
?
浏览 4
提问于2018-08-02
得票数 1
回答已采纳
1
回答
在
Spark
DataFrame
中按
数组
值过滤
、
、
、
、
我正在使用带有elasticsearch的apache
spark
1.5数据帧,我试图从包含id
列表
(
数组
)的列中过滤id。例如,elasticsearch列的
映射
如下所示: "people":{ "artist中,我尝试这样做:val
dataFrame
= sqlContext.read
浏览 0
提问于2016-02-25
得票数 2
回答已采纳
1
回答
对SparkSQL中
数组
列的每个元素执行UDF (需要另一个火花作业)吗?
、
、
、
、
另一个单元表(tbl_b)在id到new_id之间有相应的
映射
。这个表很大,不能加载到内存中。1 | 'aiks'...我打算创建一个新的hive表,使其具有与tbl_a相同的结构,但
将
id
数组
转
换为
new_id
数组
:A | ['aiks','fsijo','fsdix','sssxs','有
浏览 4
提问于2017-06-01
得票数 1
回答已采纳
1
回答
如何
将
numpy
数组
元素转
换为
spark
RDD列值
、
、
我准备使用
spark
dataframe
(不是pandas)的内置CSV打印工具。我已经构建了一个IndexedRowMatrix。因此,它中有稀疏
数组
列。到密集
数组
的转换是由x.vector.toArray()
映射
调用执行的(如下所示)。我似乎想不出,如何
将
密集的numpy
数组
元素放入
Spark
DataFrame
的单独列中。(我不是在介绍熊猫。)问题是RDD tuple有2列,但我需要在
DataFrame
中有7
浏览 0
提问于2018-06-12
得票数 0
1
回答
摧毁星火
DataFrame
、
、
、
、
Spark
版本的1.5和我正试图
将
具有名称值组合的输入数据name转
换为
一个新的数据name,其中所有的名称都被转
换为
列,并将值转
换为
行。I/P
DataFrame
:1 Country US 2 State NY 4 State MH 5 State NJ 5
浏览 10
提问于2016-03-02
得票数 5
1
回答
Scala/Apache火花转换
DataFrame
列值和类型,否则为多次
、
、
、
目前,我有一个工作实现,
将
性别从0、1、2、3(整数)转
换为
“男性”、“女性”、“跨”等(字符串)。尽管下面的方法确实有效,但将带有这些
映射
的独立
数组
添加到
DataFrame
中、将其连接到主表/
DataFrame
、然后删除、重命名等等,似乎效率很低。由于这段代码
将
处理数据的TBs,是否有一种更少重复和更有效的方法来完成这一任务。谢谢您提前提供帮助!, "Prefer not to answer")} private
浏览 1
提问于2017-09-11
得票数 2
回答已采纳
1
回答
将
数据流中的数据写入拼接
、
、
、
': 'test'}, {'name': 'more'}, {'name': 'other'}])我现在要做的是
将
元组的第二部分写到元组的第一部分所标识的位置在其他地方,我使用以下命令
将
每个字典
列表
转
换为
DataFrame
:
dataframe
浏览 1
提问于2015-07-28
得票数 4
1
回答
spark
dataframe
根据条件从多列中选择值
、
( col1中的col1和col2 ordered.If x索引2的值以及col2中的值索引也是2)|id |col1 |col2 | |1 |["x
浏览 3
提问于2019-11-25
得票数 0
1
回答
Spark
HiveContext获取与配置单元客户端选择相同的格式
、
当配置单元表有像
映射
或
数组
这样的值时,如果你在配置单元客户端选择它,它们会显示为JSON,例如:{"a":1,"b":1}或[1,2,2]。在
Spark
中选择这些对象时,它们是
DataFrame
中的贴图/
数组
对象。当我使用
Spark
的HiveContext时,我想使用与Hive客户端相同的格式。 我该怎么做呢?
浏览 1
提问于2018-07-20
得票数 0
2
回答
BSONObject到
DataFrame
的RDD
、
、
、
按照的描述,我正在从Mongo加载一个bson
转
储到
Spark
中。它是有效的,但我得到的是:它基本上应该是包含所有String字段的JSON。我的其余代码需要一个
DataFrame
对象来操作数据。但是,当然,toDF在该RDD上失败了。如何将其转
换为
所有字段均为String的
Spark
DataFrame
?如果能有类似于
spark
.read
浏览 1
提问于2016-10-04
得票数 1
2
回答
使用两个不同目录中的头和数据创建
DataFrame
/ Dataset
、
、
在这里,我想创建一个
Dataframe
/Dataset。 .read .option(
浏览 2
提问于2018-06-06
得票数 0
回答已采纳
2
回答
为什么
列表
应该先转
换为
RDD,然后再转
换为
Dataframe
?有没有办法把list转换成
dataframe
?
、
、
、
我是
spark
的新手,我有一些简单的问题。我想使用prefixspan的方法,但它只支持数据集和数据帧。因此,我
将
list转
换为
rdd,然后将其转
换为
dataframe
。为什么
列表
不能直接转
换为
dataframe
?Row([[1, 2], [3]]), Row([[1], [3, 2], [2]]), Row([[1, 2], [5]]), Row([[6]])]rdd =
spark<
浏览 71
提问于2021-09-28
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Pandas:Series和DataFrame数据选择方法
这些很实用的Pandas技巧,你都会了吗?-乌森数据可视化系列(1)
Spark 2.4 原生支持了avro,别再引用第三方库了
Spark SQL,DataFrames 以及 Datasets 编程指南
Pandas中高效的“For循环”
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券