腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用
Pandas
GroupBy
找到
每组
的
一半
、
、
、
我需要
使用
groupby
选择
一半
的
数据帧,其中每个组
的
大小是未知
的
,并且可能因组而异。我需要
的
是只取
每组
的
前半部分(或楼层(N/2))。根据我(非常有限
的
)
使用
Pandas
groupby
的
经验,应该是这样
的
: df.
groupby
('participant_id')[['
浏览 22
提问于2017-06-28
得票数 7
回答已采纳
2
回答
如何将
pandas
groupby
parts通过管道发送到seaborn distplot?
、
、
我正在学习在
pandas
中
使用
.pipe方法,并且想知道我们是否可以
使用
它来绘制
每组
groupby
的
距离图。MWE问题<code>A1</code>输出与for-loop相同,但<em
浏览 39
提问于2020-06-08
得票数 3
回答已采纳
2
回答
大熊猫发现多重层次平均数
、
、
假设我在
Pandas
dataframe中有如下数据:我希望
找到
以下
的
描述性统计数据(平均值、中位数、标准开发): 每个队列-> {a:3},{b:2},.然后
找到
该系列
的
描述性统计数据。我正在
使用
Pandas
,我完全被困在如何做这么简单
的
事情上。我正在考虑<e
浏览 5
提问于2016-05-10
得票数 1
回答已采纳
2
回答
如何为分组中
的
每一列创建多个汇总统计信息?
、
、
使用
groupby
().agg()可以计算指定列
的
汇总统计信息。但是,如果我想为
每组
数据帧
的
每一列计算“min”、“max”和“mean”,该怎么办?有没有办法让
pandas
自动为每个列名附加一个前缀?我不想枚举agg()函数中
的
每个基本列名。
浏览 8
提问于2021-07-20
得票数 0
1
回答
使用
groupby
和NaN列选择第一行
、
、
我正在尝试选择数据帧
每组
的
第一行。import
pandas
as pdx = [{'id':"a",'val':np.nan, 'val2':-1},{'id':"a",'val':'TREE','val2':15}]# 0 a Na
浏览 1
提问于2014-09-29
得票数 0
回答已采纳
1
回答
使用
groupby
和head过滤DataFrame (有条件)
、
、
我想
使用
pandas
groupby
和head有条件地过滤这个数据帧。6], ['No', 3], ['Maybe', 10], ['Maybe', 2],过滤
的
行数是可变
的
,但始终应该是偶数(
每组
的
最大偶数行)。B1
浏览 0
提问于2017-12-27
得票数 0
1
回答
自定义分组pd.df,以向量化方式计算OHLC
、
、
、
、
我想要打开/高/低/关闭数据帧
的
区块,其中df.volume >= threshold。可重现
的
例子: df = pd.DataFrame(index=pd.date_range('2018-01-02', periods=10000, freq='ms'),,这是非常慢
的
: threshold = 5000count = 1for idx, row in df.iterrows(): vol += row[vol
浏览 18
提问于2020-10-05
得票数 1
2
回答
如何
使用
键组合行并保持最高值
Pandas
、
、
我有一个有几个行和几个列
的
dataframe,我需要将其他列a、b、c
的
值组合成相应键
的
一行。111 0 12 0111 0 0 12222 0 0 12111 12 12 12谢谢你
的
帮助
浏览 2
提问于2022-05-02
得票数 1
回答已采纳
1
回答
查找至少某个值
的
第一个值
、
我在这上面花了几个小时,所以任何帮助都将是令人惊讶
的
! 我有一个熊猫数据帧df。然后我按其中一列(A)分组,关注另一列(B),并获得
每组
的
平均值: group_mean = df.
groupby
('A').B.agg('mean') group = df.
groupby
('A').B 按照上面的顺序,以下是python报告
的
类型: <class '
pandas
.core.series.Serie
浏览 2
提问于2021-09-04
得票数 0
2
回答
Pandas
groupby
抛出: TypeError:不可散列类型:'numpy.ndarray‘
、
、
、
我有一个数据帧,如图所示: <ipython-input-100-6f2c8b3de8f2> in <module>()
pandas
浏览 30
提问于2019-07-06
得票数 2
回答已采纳
2
回答
熊猫组后每一组取样
、
、
、
、
我知道这一定是在哪里被回答
的
,但我就是找不到。 'b': [1,1,1,0,0,0,0]}) # now sample from each group, e.g., I want 30% of each group
浏览 2
提问于2016-04-03
得票数 67
回答已采纳
3
回答
Python
Pandas
中
的
GroupBy
函数,如SUM(col_1*col_2)、加权平均等
、
是否可以直接计算两列
的
乘积(例如sum),而不
使用
使用
它要快得多(不到我机器上时间
的
一半
)。df['helper'] = df.a*df.bgrouped['helper'].sum() df.drop('helper', axis例如,计算
每组
的
加
浏览 0
提问于2012-04-04
得票数 9
回答已采纳
1
回答
如何并行处理大熊猫
的
子数据
、
imeis: # calculate feature我想
使用
是否有任何好
的
方法并行地实现这一点?希望
的
结果是 每个imei。
浏览 4
提问于2021-04-15
得票数 1
2
回答
如何统计其他sub中
的
sub
、
、
、
我有一个数据帧,如下所示:4 male group C some college standard 问:我想
找到
一种方法来分别统计<em
浏览 0
提问于2021-01-21
得票数 0
0
回答
pandas
groupby
中
的
聚合函数会以不同
的
方式对待内置函数吗?
、
、
':['X', 'X', 'Y', 'Y', 'Y', 'Y', 'Z', 'Z']})x.
groupby
('cat1').agg(lambda x: set(x)) cat2 ca
浏览 3
提问于2017-11-29
得票数 5
1
回答
熊猫指的是第2栏中每个不同实例
的
第1栏。
、
、
我有一个包含房屋列表和每栋房子
的
“GROSSAREA”列
的
数据,以及“YEARBUILT”列。你能把它从最低到最高
的
年份吗?
浏览 1
提问于2022-01-21
得票数 0
1
回答
如何通过等指数来提取均值和波动率?
、
我有一个CSV文件,如下所示(根据iy对数据帧进行排序后):1,801,701,602,302,15我试着计算当iy相等时
的
平均值和波动值例如,对于上面的CSV,我需要
的
内容如下所示:1,80,70,101,70,70,01,60,70,-102,35,25,102,25,25,0 这里u是当iy相等时u
的
平均值,u‘是u
浏览 13
提问于2020-06-03
得票数 2
回答已采纳
1
回答
熊猫-统计
groupBy
结果
、
我正试着用熊猫得到一组最受欢迎
的
国家名称。正如在片段中看到
的
那样,我已经走了
一半
的
路,但我不清楚如何将groupedByCountry转换成一个排序表。import mathcsv =
pandas
.read_csv(".= csv[["name",'country']] groupedByCountry = filte
浏览 2
提问于2015-11-06
得票数 1
回答已采纳
1
回答
分组并在PySpark数据帧中创建新列
、
我有一个像这样
的
火种数据帧,|id_ | p || 1 | AC || 2 | A |---------------------sample.
groupby
(by=['id_'], g
浏览 6
提问于2019-08-20
得票数 1
回答已采纳
1
回答
获取
pandas
中时间序列
的
时间跨度
、
、
我正在尝试获取
每组
条目(时间序列)
的
时间跨度。这些条目没有排序。在
pandas
中有比
使用
max-min更有效
的
方法吗?我已经尝试过时间增量和周期函数,但它们不能返回我需要
的
结果。import
pandas
as pd[1,'2018-3-1' ],[1,'2018-5-2' ], [1,'2018-42017-5-15
浏览 10
提问于2019-04-30
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pandas的groupby问题
使用Pandas读取复杂的Excel数据
Pandas分组与聚合(一)
你可能不知道的10个Python Pandas的技巧和特性(下)
使用 Pandas resample填补时间序列数据中的空白
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券