腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
熊猫无法使用
聚合
函数
列表进行
聚合
。
、
、
如何指定
自定义
聚合
函数
,使其在
pandas
.DataFrame.aggregate
的
列表参数中使用时行为正确import
pandas
as pddef ok_mean(x): df.aggregate(['mean', np.max, ok_mean])(不在列表
中</
浏览 4
提问于2019-02-26
得票数 4
1
回答
Python
中
的
自定义
聚合
函数
、
、
我一直在为
Pandas
中
的
自定义
聚合
函数
的
问题而挣扎,而我一直无法解决这个问题。':np.arange(1, 5)})df.agg({'value': 'mean'})但是,如果我定义了以下
自定义
mean
函数</em
浏览 6
提问于2020-08-24
得票数 2
回答已采纳
1
回答
PySpark
中
的
有状态
聚合
函数
、
、
、
在PySpark
中
,我试图定义一个
自定义
聚合
器,它正在累积状态。在斯帕克2.3有可能吗?AFAIK,现在可以通过使用PySpark关键字调用
pandas
_udf,从Spark2.3 (cf )开始在PandasUDFType.GROUPED_AGG
中
定义
自定义
的
PandasUDFType.GROUPED_AGG但是,考虑到它只是将一个
函数
作为参数,我认为在
聚合
过程
中
不可能携带状态。从Scala
中
,我
浏览 0
提问于2018-10-02
得票数 1
1
回答
如何在聚集熊猫数据时进行字符串操作?
、
我需要对熊猫
的
数据进行一些汇总。我用
的
是熊猫版本1.3.3。在这个例子
中
,有人能告诉我我做错了什么吗?使用
自定义
函数
进行字符串
聚合
的
正确方
浏览 12
提问于2022-03-03
得票数 1
回答已采纳
1
回答
Pandas
聚合
中
的
自定义
函数
、
FROMHERE xxxxxxCode mean=('sum',(lambda x: mean(absolute(x - mean(x)))))模仿平均偏差,因为它不是直接构建在Numpy
中
,我得到以下错误: KeyError: "[('ar', '<lambda>')] not in in
浏览 11
提问于2019-11-12
得票数 1
回答已采纳
1
回答
pandas
group by agg根据pattern在组内选择
、
、
我正在尝试编写一个
自定义
聚合
函数
,它将始终从每个组中选择以最少零结尾
的
字符串。例如,下面是一个数据帧示例: import
pandas
as pd df = pd.DataFrame({"group" : [1, 1, 1, 2, 2], "value" : ["10534","30400", "30400", "34355", "35000"]}) 我在这里
浏览 28
提问于2021-08-16
得票数 0
回答已采纳
1
回答
pandas
自定义
聚合
函数
、
、
、
我有一个
pandas
dataframe,下面的命令对它起作用: house.groupby(['place_name'])['index_nsa'].agg(['first','last']) 它给了我我想要
的
现在,我想创建一个
自定义
聚合
值,它给出了第一个值和最后一个值之间
的
百分比变化。 我在对值进行数学运算时遇到了错误,所以我假设我必须将它们转换为数字。house.groupby(['place_name
浏览 22
提问于2019-06-23
得票数 1
回答已采纳
1
回答
将
自定义
聚合
函数
应用于熊猫DataFrame
、
我想返回col_x * col_y之和除以col_x之和import
pandas
as pd return sum(x * y) / sum(x) result = df.agg(aggregation_function, axis="columns", args=(&q
浏览 1
提问于2020-09-29
得票数 2
回答已采纳
1
回答
pandas
.groupby.aggregate
、
、
、
我试图使用
自定义
聚合
函数
来提高
pandas
.groupby.aggregate操作
的
性能。我注意到--如果我错了--
pandas
按顺序调用每个块上
的
聚合
函数
(我怀疑它是一个简单
的
for-loop)。由于
pandas
在很大程度上是基于numpy
的
,是否有一种方法可以使用numpy
的
矢量化特性来加速计算?在我
的
代码<e
浏览 1
提问于2020-12-01
得票数 5
回答已采纳
0
回答
在
pandas
DataFrame
的
多个列
中
应用
自定义
函数
、
[1,2,3], [4,3,3], [3,2,5], [2,2,4]]我想对每一行应用一个
自定义
函数
然后我想按键
聚合
(例如,average)。result1 2 32.673 4 19.00 我知道我可以通过使用循环来做到这一点,但我希望用最python/
pandas</em
浏览 4
提问于2018-07-14
得票数 0
1
回答
在dask上按组应用
函数
的
最佳实践
、
、
我有一个很大
的
数据集存储在hdf5文件
中
,我需要执行一些操作。df.groupby(['center', 'sku'])['units'].agg([np.mean]).compute() 但是,如果我尝试应用一个
函数
units'] \这需要大约13分钟,
浏览 12
提问于2019-11-15
得票数 2
回答已采纳
2
回答
pandas
dataframe
中
的
值按键排序类似于python
的
sorted()
、
我需要按
自定义
聚合
函数
对数据帧进行排序,例如,它们
的
值之和,类似于带有key参数
的
sorted
函数
: sorted([(1, 10), (1, 2), (2, 3)], key=sum) 这就给出了:[(1, 2), (2, 3), (1, 10)] 我知道在
pandas
中
我可以创建一个新
的
聚合
列并按列排序: df = pd.DataFrame([(1, 10), (1, 2), (2, 3)])df[2] = df
浏览 46
提问于2019-06-17
得票数 1
回答已采纳
1
回答
将PySpark
中
的
两个DataFrames组合成矩阵
、
、
、
14 | ['ghi', 'jkl']|+----+---------------+ 我希望通过组合上面的两个DataFrame并在关键字和python
函数
定义
的
标记之间执行一些复杂
的
计算
浏览 2
提问于2019-11-22
得票数 0
2
回答
在Python
Pandas
中
,如何使用like R dplyr mutate_each
、
、
、
在Python
Pandas
中
,我想通过对多个列执行多个
聚合
函数
来添加列,比如R mutate_each。例如,Python
Pandas
能否实现与以下R脚本相同
的
处理?%>% mutate_each(funs(min, max, mean), starts_with("Sepal")) 然而,我能够实现与使用
Pandas
的
变异体相同
的
处理。如下面
浏览 3
提问于2017-10-18
得票数 5
2
回答
Pandas
滚动:
聚合
布尔值
、
、
在
pandas
.DataFrame中有没有滚动
的
" any“
函数
?或者,是否有其他方法可以在滚动
函数
中
聚合
布尔值?考虑一下: import
pandas
as pd s = pd.Series([True, True, False, True, False, False, FalseAttributeError: 'Rolling' object has no attribute 'any&
浏览 23
提问于2020-03-24
得票数 1
回答已采纳
1
回答
根据列
中
的
值,有条件地
聚合
具有不同
函数
的
分组数据框
、
,方法是对group_id进行分组,然后对每个组应用不同
的
聚合
函数
。为了确定使用哪个
聚合
函数
,我想设置一个条件,该条件引用df
中
的
另一个列,即condition。 具体地说,我想取"ones"组
的
val中所有元素
的
和和"tens"组中所有元素
的
平均值。(但我不需要从condition中提取
聚合
函数
的
名称。condition列
浏览 21
提问于2021-01-24
得票数 1
回答已采纳
1
回答
Pandas
.DataFrame.GroupBy.agg,
聚合
函数
中
需要
的
独立列。如何让它进入agg?
、
、
我有一个带有两级MultiIndex
的
Pandas
DataFrame对象。此外,它显然包含许多额外
的
列(例如'A','B','C','D','E')。我想对DataFrame
中
的
单个多索引执行一些
聚合
函数
,这些索引来自可用列
的
子集(例如,'C','D','E')
中
的<
浏览 4
提问于2020-04-29
得票数 0
1
回答
用火花放电写
自定义
的
联非新议程
、
、
、
我需要编写一个
自定义
的
pySpark,我遇到了这个例子。在类似的行
中
,如线程
的
最后一部分所示,我提出了以下
函数
StructField("keyDoubleType()), StructField("bf_signature", Binary())
浏览 1
提问于2019-04-04
得票数 1
1
回答
用于
聚合
的
OrientDB注册
自定义
函数
正如本页底部所写
的
,我们可以在OrientDB
中
构建
自定义
函数
。但是,这个示例只显示了执行内联操作
的
自定义
函数
。有任何方法可以编写执行
聚合
操作
的
OrientDB
函数
吗?因此,问题更多
的
是如何访问
自定义
函数
中
该字段
的
“当前”记录值,以便执行
聚合
操作。
浏览 12
提问于2015-08-08
得票数 0
回答已采纳
1
回答
使用df.agg(...)当
自定义
函数
包含在列表
中
时,在
函数
列表上失败
、
我希望
聚合
一组列,每个列都有两个
函数
:np.mean和quart_1。所有列都是数字。np.mean是从numpy导入
的
,quart_1是一个
自定义
函数
,它返回列
的
第一个四分位数: return np.percentile(x, 25) 问题是,如果我执行错误似乎是,如果我将原始DataFrame包含在列表
中
,quart_1将返回没有任何
聚合
的
原始
Pandas
(带有一些标签)
浏览 3
提问于2017-08-05
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券