腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2224)
视频
沙龙
0
回答
带有
UDF
的
withColumn
会
生成
AttributeError
:'
NoneType
‘
对象
没有
'_
jvm
’
属性
、
、
、
、
我尝试使用
UDF
替换spark dataframe中
的
一些值,但仍然得到相同
的
错误。 在调试过程中,我发现它实际上并不依赖于我正在使用
的
数据帧,也不依赖于我编写
的
函数。这是我得到
的
错误,提到了一个相当神秘
的
"
AttributeError
:'
NoneType
‘
对象
没有
’_
jvm
‘
属性
“。_
jvm
.functions, name)
浏览 9
提问于2017-11-29
得票数 1
回答已采纳
1
回答
为什么代码有问题?我与星团相连
我试图应用一个
UDF
函数来绕过那些pct,也许有更好
的
方法,我对它是开放
的
,因为我对火花放电很陌生。当我删除
udf
函数以放弃舍入数字时,它起了作用,所以我对dataframe很有信心。以下是密码: q2_res = q2_res.
withColumn
('pct_DISREGARD
浏览 5
提问于2019-09-23
得票数 0
1
回答
星星之差
AttributeError
:'
NoneType
‘
对象
没有
属性
'_
jvm
’
、
、
、
我发现了类似的问题,但
没有
回答如何解决这个问题。 return regexp_extract(x,re_string,0) df = df
浏览 3
提问于2022-04-28
得票数 0
回答已采纳
1
回答
AttributeError
:'
NoneType
‘
对象
没有
'_
jvm
- PySpark
UDF
’
属性
、
、
、
、
我有杂志订阅和创建时间
的
数据,以及一个包含与给定用户关联
的
所有订阅到期日期数组
的
列:但是当我应用函数来创建一个列时... df = df.
withColumn
('near_expiration-dates', check_if_sub_connected(df.
浏览 21
提问于2018-12-13
得票数 2
1
回答
无法捕获Pyspark异常
、
、
、
我试图通过PysparkUDF使用日期解析器解析包含日期字符串
的
列。虽然我使用“尝试-捕捉”来捕获
属性
错误,但它不起作用。
AttributeError
:'
NoneType
‘
对象
没有
属性
'date’ parse_date =
udf
(.strftime("%Y-%m-
浏览 3
提问于2020-12-06
得票数 0
回答已采纳
1
回答
基于类方法创建PySpark数据框列-带参数
、
、
、
、
我有一个python类,它
的
函数如下: def __init__(self, json):email_name_match_
udf
= F.
udf
(lamb
浏览 11
提问于2020-11-12
得票数 0
回答已采纳
1
回答
Pyspark中
的
奇怪行为
、
、
、
我在PySpark中观察到一个奇怪
的
行为。也许你们中
的
一个
会
知道发生了什么。).count()此输出:10df.filter(df.mydate.isNotNull()).count()Py4JJavaError: An error occurred whilelambda> return lambda *a: f
浏览 34
提问于2018-01-10
得票数 0
1
回答
将
udf
调用移动到新函数后
的
azure吡火花
udf
属性
非类型
、
、
、
我从如下所示
的
udfs工作系列开始,以清除数据帧中
的
列列表,这些列与预期
的
一样工作。 def inner(df): df = df.
withColumn
df = multi_remove_some_chars(colclean_list)(df) 下一步是向类靠拢,因此
浏览 2
提问于2021-01-07
得票数 0
回答已采纳
1
回答
在Spark查询中使用F.countDistinct
、
、
我试过登记,但
没有
用。以下是我尝试过
的
: [2020, "England"], [2018, "Ireland"], [2020, "England"], ["year", "nation"] spark.sqlContext
浏览 1
提问于2021-01-14
得票数 0
回答已采纳
1
回答
当输入参数是从dataframe
的
两列连接起来
的
值时,引发
UDF
错误
、
、
、
、
下面的python代码将一个csv文件加载到dataframe df中,并将一个字符串值从df
的
单个或多列发送到
UDF
函数testFunction(...)。如果我发送一个列值,代码就能正常工作。但是,如果我从df
的
两列发送值df.address + " " + df.city,则会得到以下错误: PythonException:从
UDF
中抛出一个异常:
浏览 6
提问于2022-05-21
得票数 0
回答已采纳
1
回答
在Palantir铸造代码库中定义Pandas
UDF
的
正确方法是什么?
、
、
、
@pandas_
udf
("long", PandasUDFType.GROUPED_AGG) return v.quantile(0.95)但是,当我试图在全局范围内定义这个
udf
时,我会得到以下错误:但是,如果我在转换调用
的
函数中定义
浏览 2
提问于2021-03-02
得票数 1
回答已采纳
1
回答
AttributeError
:'
NoneType
‘
对象
没有
属性
'_
jvm
’(编码在
UDF
之外很好地工作)
、
、
、
、
我知道有类似的线程,但我无法用这些解决方案来解决我
的
错误。|-- id: long (nullable = true)def cosine_sim_
udf
(df): single_col = df.select(F.col('cosine_similarity(single_col_flatmap) return cosine
浏览 26
提问于2022-01-15
得票数 0
回答已采纳
1
回答
计算pyspark dataframe列
的
百分比
、
、
、
lambda x: x.quantile(.95)) .
withColumn
("P95_MOU_G_EDUCATION_KIDS", perc95_
udf
('MOU_G_EDUCATION_KIDS'))
浏览 0
提问于2018-09-19
得票数 7
回答已采纳
1
回答
udf
中
的
F.regexp_extract返回
AttributeError
:'
NoneType
‘
对象
没有
属性
'_
jvm
’
、
、
、
、
我完全是火花和火种
的
初学者。我有一个庞大
的
数据集,我有一组关键字需要检查并从列中提取。我
的
代码如下所示def lookhere(z) -> str: for skill_
jvm
.functions.regexp_extract(_to_java_column(str), pattern, idx
浏览 2
提问于2020-08-26
得票数 0
回答已采纳
2
回答
用groupBy计算PySpark数据
的
百分位数
、
、
、
、
我正在尝试groupBy,然后计算PySpark数据
的
百分位数。from pyspark.sql.types import FloatTypeimport numpy as np df_out = df_in.groupBy('Id').agg(func.collect_list('value&
浏览 0
提问于2018-12-14
得票数 2
回答已采纳
1
回答
如何在BeautifulSoup中捕获此异常
、
可能重复: for item in soup.find(id="start_dateid").find_all('option'):问题是当页面
没有
id="start_dateid“时,会
生成
一个
浏览 4
提问于2012-12-09
得票数 0
回答已采纳
4
回答
AttributeError
:
NoneType
对象
没有
带有
Python WebCrawler
的
属性
“
AttributeError
”
、
、
、
我正在编写一个python程序来使用urllib2、api
的
python twitter包装器和BeautifulSoup
的
组合来抓取twitter。但是,当我运行我
的
程序时,我得到以下类型
的
错误: ray_krueger RafaelNadal Traceback (most recent call last): File "C:\Python28\lib\urllib.py", line 1038, in
浏览 0
提问于2011-08-03
得票数 0
回答已采纳
1
回答
无法调用pyspark
udf
函数
、
、
、
尝试使用
UDF
函数,但遇到错误: import timefrom pyspark.sql.functions import lit,unix_timestamp,
udf
=
udf
(lambda start, end: calc_time(start, end), TimestampType()) new_df = (df.
withColumn
('time1', unix_timestamp(lit(timestamp2),'yyyy-MM-dd HH:mm
浏览 36
提问于2021-07-23
得票数 2
回答已采纳
7
回答
PySpark错误:
AttributeError
:'
NoneType
‘
对象
没有
属性
_
jvm
、
、
我有时间戳数据集,它
的
格式为电火花代码:>>> df_ts_list.
withColum
浏览 4
提问于2016-10-28
得票数 32
1
回答
将itertools.chain转换为映射
、
我是新
的
火种,并试图理解下面的代码从一些刺激
的
代码。
AttributeError
:“
NoneType
”
对象
没有
属性
“_
jvm
” 不知道这是怎么回事。有人能解释一下吗?
浏览 1
提问于2021-10-24
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python中的AttributeError:属性错误处理
Java序列化为什么必须实现Serializable接口?
又一个难题:序列化和反序列化为什么要实现 Serializable 接口
重学JAVA:探索Java虚拟机(JVM)的生命周期、结构和执行引擎
Python对象属性的那些事
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券