腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
用
PySpark
替换
多个
值
、
、
、
、
我需要将"Action“列中的
值
替换
为特定
值
。ActionName2 Midpoint4 Complete 我想用数字
替换
这些
值
浏览 39
提问于2020-11-05
得票数 0
回答已采纳
1
回答
我是否可以使用regexp_replace或其他等效工具
用
一行代码
替换
一个
pyspark
dataframe列中的
多个
值
?
、
、
、
我是否可以使用regexp_replace或其他等效工具
用
一行代码
替换
一个
pyspark
dataframe列中的
多个
值
?Xien|2010-03-02 09:33:51| 3| +------------+-------------------+-------------+ 在pandas中,我可以
用
lambda表达式
替换
一行代码中的
多个
字符串: df1[name].apply(lambda x: x.replace('
浏览 23
提问于2020-08-22
得票数 0
回答已采纳
2
回答
用电火花
替换
结构型柱的空白点
、
、
、
、
我有一个
用
例,希望
用
空
值
替换
StructType列中的空
值
。下面是示例,您可以使用它重新创建场景: ),) 我想知道如何在Name列中
替换
空
浏览 3
提问于2022-01-31
得票数 1
回答已采纳
1
回答
Pyspark
-> StringIndexer:
用
数字
替换
“无”
值
、
我有几个“无”
值
的数据框架。通过StringIndexer,将字符串列转换为浮动列后,"None“
值
被
替换
为number。谢谢。
浏览 1
提问于2018-04-29
得票数 0
4
回答
在dataframe中用null
替换
所有出现的
值
。
、
、
最初,我
用
-1填充了所有空
值
,以完成我在
Pyspark
中的联接。'Letter': ['A', '-1', 'B', 'A'], | -1| B| 30|+------+------+-----+
浏览 6
提问于2020-06-29
得票数 5
回答已采纳
2
回答
Pyspark
删除dataframe列中的
多个
字符
、
、
看一下
pyspark
,我看到translate和regexp_replace可以帮助我处理存在于数据框列中的单个字符。我想知道是否有一种方法可以在regexp_replace或translate中提供
多个
字符串,以便解析它们并用其他东西
替换
它们。
用
例:删除A列中的所有$、#和逗号(,)
浏览 0
提问于2018-06-09
得票数 10
回答已采纳
1
回答
具有
多个
参数的用户定义函数返回空
值
。
、
、
、
、
我试图将python函数转换为
PySpark
用户定义的函数,如下所示:from
pyspark
.sql.functions importudf,col,arrayfrom datetime import我正在使用
PySpark
udf创建一个新的列“
PySpark
”。但是
Py
浏览 8
提问于2022-07-11
得票数 2
回答已采纳
1
回答
使用
PySpark
在多列上执行滞后操作
、
、
、
、
我对
PySpark
相当陌生,但我正在尝试在代码中使用最佳实践。我有一个
PySpark
数据格式,我想延迟
多个
列,
用
滞后
值
替换
原始
值
。我想根据ID获取所有
值
,按date排序,然后对
值
进行一定程度的滞后。我到目前为止掌握的代码: window = Window.partitionBy(F.col("ID"))
浏览 3
提问于2022-01-04
得票数 1
回答已采纳
2
回答
pySpark
替换
行子集上的空
值
、
、
我有一个
pySpark
dataframe,其中有我想要
替换
的空
值
,但是要
替换
的
值
对于不同的组是不同的。我的数据看起来是这样的(appologies,我没有办法通过它作为文本):对于组A,我希望
用
-999
替换
空
值
;对于组B,我想用0
替换
空
值
。
浏览 5
提问于2022-11-16
得票数 3
1
回答
pyspark
2.2.1:如何用空列表填充列的空
值
、
我有一个
pyspark
数据帧,df1 ["jon", "doe"]我正在尝试
替换
空
值
并使用空列表。id alias2 [].fillna('alias', '[]') .fillna('alias', create_list([]) 以及来自的答案
浏览 5
提问于2019-08-09
得票数 2
3
回答
如何在
PySpark
中用零
替换
句号?
、
、
我试图
用
PySpark
中的0
值
替换
原始数据中的句号。 from
pyspark
.sql import functions as F dataframe2 = dataframe1.withColumn("test_col它应该只用数字重写列(例如,在非完全停止行中有一个数字,否则,它是一个句号,应该用0
替换
)。
浏览 8
提问于2019-09-01
得票数 1
1
回答
如何检测
pyspark
中的单调下降
、
、
、
我正在使用spark DataFrame,我希望检测来自特定列的任何
值
,其中该
值
不是单调递减的。对于这些
值
,我想根据排序条件将它们
替换
为以前的
值
。下面是一个概念性的示例,假设我有一个
值
为[65, 66, 62, 100, 40]的列。
值
"100“不遵循单调下降趋势,因此应
替换
为62。因此,结果列表将是[65, 66, 62, 62, 40]。下面是我创建的一些代码,用于检测必须
替换
的
值
,但是我不知道如何用前
浏览 15
提问于2020-02-14
得票数 1
回答已采纳
1
回答
在
pyspark
数据帧中用数字
替换
字符串
、
我刚接触
pyspark
,我想在
pyspark
dataframe列中动态地
用
数字
替换
名称,因为我的dataframe中有超过500,000个名称。如何继续?
浏览 9
提问于2019-07-25
得票数 0
1
回答
如何在
PySpark
DataFrame中
替换
无穷大
、
、
、
、
似乎不支持
替换
无穷大
值
。我尝试了下面的代码,但它不起作用。还是我漏掉了什么?sqlContext.createDataFrame([(None, None), (1, np.inf), (None, 2)])或者我必须走一条痛苦的道路:将
PySpark
DataFrame转换为DataFrame,
替换
无穷大
值
,然后将其转换回
PySpark
DataFrame。
浏览 7
提问于2015-12-23
得票数 6
回答已采纳
3
回答
df
替换
不适用于熊猫栏中的分隔器。
、
、
、
我有个df 'Courses':["Spark,ABCD","
PySpark
","Hadoop","Python","Pandas"], }print(df) 我试图
用
dict<
浏览 14
提问于2022-05-31
得票数 0
回答已采纳
2
回答
CSV文件中的任何" null“字符串都应
替换
为
pyspark
dataframe - Databricks中的SQL
值
null
、
、
我有一个以" null“作为字符串的Dataframe,我想将其
替换
为数据库中
PySpark
Dataframe中的SQL
值
null。 有没有人能帮个忙。我是Spark的新手。 谢谢。
浏览 38
提问于2021-09-02
得票数 2
2
回答
从行中的
多个
值
计算一个
值
、
我有一个
PySpark
Dataframe,我想添加一个从其他列的
多个
值
计算出来的列。l = [('Ankit',25),('Jalfaizy',22),('saurabh',20),('Bala',26
浏览 1
提问于2019-11-29
得票数 1
回答已采纳
2
回答
使用时间、endsWith和Regex_replace时不可调用的“列”对象
、
、
、
我有一组简单的地址数据,如下所示;简单地
用
缩写
替换
街道名称:43421 Margarita St在我的电火花程序中,我只是简单地使用regexp来
替换
缩写,比如“路”、“街”等等。from
pyspark
.sql import *from
pyspark
.sql.functions import colendsWith("Ave&qu
浏览 6
提问于2021-11-10
得票数 0
回答已采纳
4
回答
用
PySpark
中的其他数据
替换
空
值
、
、
、
现在,我想用Map和已经有描述的行来填充DF中缺少的
值
,使用
Pyspark
将它们保持不变。
浏览 0
提问于2019-08-22
得票数 0
回答已采纳
1
回答
如何将
PySpark
中的所有列的字符串
值
替换
为NULL?
举个例子,我有一个dfdf = sc.parallelize([]).toDF() 现在,我希望将NULL、NA和NaN
替换
为(N
浏览 9
提问于2017-12-06
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
快速处理多个文件的文件名,用符号替换空格
高级替换真好用,一次替换多个不同内容无烦恼,让替换变得随心所欲
利用Python实现表格中指定列的值替换
Excel VBA 8.39公式错值BUG多 批量将错值替换为数字
C++的函数如何返回多个值?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券