腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1038)
视频
沙龙
1
回答
pyspark
dataframe
如果
不存在
,
则
添
加值
、
我有一个下面的
dataframe
,每当管道运行时,它就会被覆盖,它会添加新的列,其中包含运行日期和每个表的计数。tbl_name")))tbl_name 2019_07_24 2019_07_25def 234 567
如果
将来添加新的表名
浏览 4
提问于2019-07-25
得票数 0
3
回答
pyspark
dataframe
如果
列
不存在
,
则
添加该列
、
、
、
abc2", "d":"abc"}我想聚集列'b','c','d‘和'f’上的数据,这些数据在给定的json文件中
不存在
因此,由于列'f‘
不存在
,我们可以将该列作为空字符串。我正在读取输入文件并像这样聚合数据 imp
浏览 0
提问于2017-03-01
得票数 17
回答已采纳
1
回答
Pyspark
从列表中添加一列重复值
、
、
我有一个
pyspark
dataframe
,我想添加一个列,它以重复的方式从列表中添
加值
。
如果
这只是python,我可能会使用itertools的循环函数。我不知道用
pyspark
怎么做。
浏览 27
提问于2021-03-10
得票数 1
回答已采纳
1
回答
在自定义包中创建
pyspark
dataframe
?
、
、
、
但是假设我有一个函数,它接受一些数据列表或字典,预期的输出是包含数据的
pyspark
dataframe
。我认为单个会话应该足够了,因此需要检查会话是否存在,
如果
不存在
,
则
创建一个会话。try: sc =
pyspark
.SparkContext(mastersqlContext = SQLCon
浏览 2
提问于2020-10-31
得票数 0
7
回答
如果
对象属性值存在,如何增加它的值,否则设置初始值?
如何添加检查以查看键是否已经存在,
如果
存在,
则
增
加值
,
如果
不存在
,
则
设置初始值。
浏览 4
提问于2013-09-09
得票数 47
回答已采纳
2
回答
如何创建空的考拉df
、
我正在尝试使用以下命令创建空的考拉
DataFrame
但是我得到了以下错误我也尝试了执行命令,但发现了类似的错误<e
浏览 3
提问于2020-08-24
得票数 0
1
回答
PySpark
-
如果
存在列,
则
选择
dataframe
.select
、
在尝试执行不返回列从而导致过程失败的
dataframe
.select之前,如何测试字段的存在性。
浏览 4
提问于2022-06-21
得票数 0
回答已采纳
1
回答
从
PySpark
中的复杂列中提取值
、
、
我有一个
PySpark
数据帧,它有一个复杂的列,请参考下列值:1 [{"label":"animal","value":"cat"},{"label":null,"value":"George"}] 我想在
PySpark
dataframe
中添加一个新列,它基本上将它转换为一个字符串列表。
如果
Label为null,
则
字符串应包含value;<
浏览 0
提问于2021-02-09
得票数 0
2
回答
如果
字段
不存在
,
则
向其添
加值
、
如果
字段
不存在
,我将如何“添加”数据? datafieldrow002: |b||c|row004: 我如何创建一个mySQL查询,
如果
该行中
不存在
这个查询
浏览 1
提问于2019-11-11
得票数 0
1
回答
如果
Jquery
不存在
,
则
向数组添
加值
、
、
我有下面的函数,
如果
数组
不存在
,它会向数组中添加一个值。
浏览 1
提问于2017-05-28
得票数 0
2
回答
是否可以使用Glue更新和插入AWS glue数据库中的数据?
、
、
所以我正在使用AWS
pyspark
,每天都有千兆字节的数据,这些数据正在更新。我希望在glue数据库中的现有表中找到数据的id,
如果
id已经存在
则
更新,
如果
id
不存在
则
插入。 能用AWS胶水做吗?
浏览 9
提问于2021-05-08
得票数 1
回答已采纳
2
回答
如果
不存在
熊猫,
则
向multiIndex添
加值
、
、
8.0000000000 0.0097070545 0.0553721351 0.1753057659 18.0297726012 0.0030711499
如果
值
不存在
,我需要向索引radiotap.mcs.index添
加值
,并使用相同索引sector的相同值填充最后两列(但这并不重要)。
浏览 18
提问于2020-09-15
得票数 1
1
回答
创建一个新列,详细说明一个
PySpark
数据row中的行是否与另一列中的一个行匹配。
、
、
、
我想要创建一个函数,该函数从
PySpark
中的左联接创建一个新列,详细说明一个列中的值是否匹配或不匹配另一个
dataframe
逐行的列。例如,我们有一个
PySpark
dataframe
(d1)具有列ID和名称,另一个
PySpark
dataframe
(d2)具有相同的列- ID和Name。我试图创建一个连接这两个表的函数,并创建一个新列,
如果
两个数据文件中存在相同的ID,
则
创建一个显示“True”或“False”的新列。(not sure wha
浏览 3
提问于2021-12-11
得票数 0
1
回答
在python中转置重复列的数据帧
、
、
、
、
但我面临的问题是在info列中,有些值重复,有些不重复,
如果
列名重复,
则
必须在该列中附加数据,
如果
不重复,则应添加另一列.So预期输出如下:在
dataframe
df中,它与列AA相同,因此在下一个AA出现之前,所有列都会转换为行。在这些CC中,列对于AA
不存在
,因此它必须为空,但是对于下一个AA,列CC存在,因此它应该附
加值
。
浏览 16
提问于2019-12-03
得票数 2
2
回答
MongoDB
如果
不存在
,
则
向数组添
加值
、
、
现在我想添加新的对象,
如果
我的数组不包含它们的话。示例: 我在集合中已经有了这两个名为"test1“和"test2”的对象。我现在想插入对象"test2“、"test3”和"test4“。
浏览 1
提问于2017-02-08
得票数 7
回答已采纳
1
回答
字符串中的
Pyspark
双字符替换避免未映射到pandas或rdd的特定单词
、
、
、
、
我继承了一个修改
pyspark
dataframe
中一些字符串的程序。其中一个步骤涉及从字符串中的一些单词中删除双/三/等字母,以及一个额外的例外列表,即使它们有重复的字母也会保持不变。目前,这是通过将
dataframe
转换为具有udf的pandas,然后在读回
pyspark
之前对生成的pandas
dataframe
中的字符串应用自定义函数来完成的。我需要直接在
pyspark
中执行相同的函数。连续字符删除函数逐字读取字符串,检查单词是否在例外列表中,
如果</
浏览 7
提问于2021-03-15
得票数 0
回答已采纳
1
回答
在
Pyspark
中从
dataframe
插入或更新增量表
、
、
我目前有一个
pyspark
dataframe
,我最初使用下面的代码创建了一个增量表-现在,由于上面的
dataframe
我想知道我如何用python编写通用的
pyspark
代码,
如果
它
不存在
就创建增量表,
如果
增量表exists.This我想做的事情追加记录,因为
如果
我把我的python包给别人,他们的环境中就不会有相同
浏览 1
提问于2021-02-24
得票数 4
2
回答
PySpark
配置单元SQL -未插入数据
、
、
、
、
我想插入一些数据,我的表“测试”通过一个
pySpark
脚本(火种的python)。我写这个脚本是为了给它添加一个新行(1,dog):from
pyspark
import SparkContextdataToInsert.write.mode("append").insertInto("animals"
浏览 2
提问于2018-01-25
得票数 0
1
回答
如何在映射中检查重复地址
、
、
我希望有一个映射,只有当值是唯一的时候,才有可能添
加值
。不可能添加重复的键,但我无法让它工作。//cancel transaction - payout if the randomValue exists } 在本例中,我试图检查randomValue值是否为空-
不存在
如果
它
不存在
,
则
后面的代码可能会执行。
如果
它确实存在,
则
代码必须停止。然而,我无法找到解决办法。
浏览 0
提问于2017-09-08
得票数 1
回答已采纳
2
回答
SQLite添加或插入值
、
、
、
例如,在表中存在具有值"123“的行(”exml“),而我想要添
加值
"4567”。之后必须是"1234567",
如果
值
不存在
,
则
必须是"4567",请帮帮我..
浏览 0
提问于2012-09-19
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PySpark,一个大数据处理利器的Python库!
PySaprk之DataFrame
Python开源数据分析工具TOP 3!
如何在CDH集群上部署Python3运行环境及运行Python作业
Dataiku DSS Code Recipe 介绍
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券