腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9774)
视频
沙龙
0
回答
如
何在
使用
groupby
后
获得
行
子集
的
平均值
?
、
我想要
获得
数据帧中特定列中特定
行
子集
的
平均值
。我可以用从我
的
原始Dataframe中
获得
我想要
的
特定
行
的
平均值
,但是我
的
问题是我想在
使用
groupby
操作之后执行这个操作。我是建立在 df.
groupby
(["A", "B&qu
浏览 13
提问于2016-07-16
得票数 1
1
回答
熊猫多层次数据
的
细分
、
、
、
我正在成功地
使用
groupby
()函数来计算分组数据
的
统计信息,但是,现在我想对每个组
的
子集
进行同样
的
计算。我似乎无法理解如何为每个组(作为
groupby
对象)生成
子集
,然后将其应用于group be函数(
如
mean() )。以下一
行
按预期工作:我如何将各个组<em
浏览 0
提问于2018-10-25
得票数 4
回答已采纳
1
回答
熊猫数据:从原始数据中减去
子集
数据
的
平均值
、
、
、
(即1200
行
* 10 pd.Dataframe)data_sub = data_org[data_org.index.year例如,或 mean_sub = data_sub.
groupby
(data_sub.index.month因此,总之,我希望从原始数据
的
子集
(例如,仅<em
浏览 1
提问于2021-07-13
得票数 1
回答已采纳
2
回答
如何通过Python
获得
特定类别的
平均值
、
、
、
我想知道如何通过Python计算特定类别的
平均值
?我有一个名为demo.csv
的
csv文件 import numpy as np X =pd.read_csv('demo.csv')Category Totals estimates4 10032196 0.132 2714
浏览 1
提问于2016-07-30
得票数 1
回答已采纳
1
回答
熊猫-
使用
groupby
()时避免布尔结果
、
、
我有这样
的
剧本:输出:我希望保持相同
的
groupy(),但是将"investment_in_millions“列
的
结果过滤为
平均值
> 10或其他值。如果我用:
浏览 0
提问于2020-08-04
得票数 0
回答已采纳
1
回答
实现了
groupby
,并希望在.csv文件中通过
groupby
的
输出插入
、
、
我
的
数据集中大约有8781
行
。我已经根据月份对不同
的
项目进行了分组,并计算了每个月特定项目的
平均值
。现在,我想在每个月之后插入新
行
后
存储每个月
的
结果。下面是我对项目进行分组并计算
平均值
的
代码。任何人,请告诉我如
何在
每个月之后插入一个新
行
,并在其中存储我
的
groupby
结果。=df['day'].
groupby
(df['
浏览 0
提问于2017-11-20
得票数 1
1
回答
时间序列建模在f#-- seq对数组和向量对列表和泛型列表中
、
如果我想在F#中
使用
时间序列类型来保持股票价格,我应该
使用
哪种基本类型?我们需要我读过array有更好
的
性能,seq有一个较小
的
内存脚注,list更适合添加项,F# vector对于某些数学计算更容易。为了平衡所有的权衡,您如
何在
f#中建立
浏览 2
提问于2011-02-12
得票数 6
回答已采纳
1
回答
尝试从优化
的
groupby
方法中
获得
所需
的
DataFrames
、
、
、
、
我试图通过调用DataFrames和df.
groupby
('index_column').min()从这个更大
的
DataFrame中创建更小
的
df.
groupby
('index_column').min(),其中index_column是df
的
列,现在我希望它成为新
的
Min和Max DataFrames
的
索引。将我前面所说的话放在上下文中,我将
使用
我所做
的
例子: 在标准输出中,主DataFram
浏览 2
提问于2015-01-26
得票数 0
回答已采纳
1
回答
在
使用
块大小时获取
平均值
。
、
我有一段来自
的
代码,它帮助我在python上
使用
块大小时
获得
平均值
。chunks = pd.read_csv("f.csv",chunksize=3)但是对于我
的
新场景,我不需要按ID进行分组,而是获取总体
平均值</em
浏览 3
提问于2021-06-06
得票数 0
回答已采纳
1
回答
大熊猫按总数分类,总数在底部。
、
、
、
= cut(df['A'], bins = [0, 2, 6, 8]) 'B': np.average跑完
后
:df.
groupby
(['buc1']).agg(aggFunc) A B(0, 2] 3 6.5(6, 8] NaN NaN
浏览 6
提问于2015-10-27
得票数 9
2
回答
仅
使用
数据框
的
子集
进行计算
、
我有一个超过100,000
行
和15列
的
df。因此,例如,仅
使用
此df
的
前40
行
,并计算这些
行
的
平均值
。
浏览 2
提问于2020-03-27
得票数 0
2
回答
Python数据帧中
的
置信区间
、
、
我正在尝试计算大型数据集中"Force“列
的
平均值
和置信区间(95%)。我需要通过
使用
groupby
函数对不同
的
“类”进行分组来
获得
结果。当我计算
平均值
并将其放入新
的
数据帧中时,它给出了所有
行
的
NaN值。我不确定我走
的
是不是正确
的
路。有没有更简单
的
方法可以做到这一点?'Force': [50,150,100,120,140,160]
浏览 2
提问于2018-11-28
得票数 10
回答已采纳
1
回答
为每个x值绘制y值
的
平均值
、
、
我有一个df,它没有排序,大约有750,000
行
。现在,我想按mrwSmpVWi对df进行分组,并
获得
mrwSmpP
的
平均值
。例如:我有2,000个mrwSmpP值用于mrwSmpVWi = 3,我想得到2,000个值
的
平均值
。如果我对每一个x值都有一个y值,我想用另一个组来绘制它,即列Seriennummer。我只会得到我
的
平均值
的
直线。 编辑: 我是这样
浏览 2
提问于2020-10-02
得票数 0
回答已采纳
1
回答
熊猫:在某些
行
上取
平均值
,然后作为数据返回。
、
我有这样
的
df它包含了speed和dir在不同
的
日期
的
时间分钟。例如,第一
行
记录在7:11,20060101,dir=87, speed=5。现在,我认为数据可能太精确了,我希望在以后
的
计算中
使用
每小时
平均值
。我该怎么做呢?具体来说,我想知道 如果我
使用
的
groupby
方法是解决这个问题
的
正确方法?如果是这样的话,以后如何
使用
它作为数据文件呢?(我还需要
获得
浏览 3
提问于2017-03-08
得票数 2
回答已采纳
2
回答
如
何在
groupby
上应用自己构建函数
、
、
使用
以下代码,很容易找到
平均值
: data= importdata('871687110001543570.csv')data_perhour.drop print(dat
浏览 15
提问于2019-05-29
得票数 0
回答已采纳
3
回答
将DataFrame过滤为重复项和计算组--对结果
的
处理方法
、
、
、
好吧,下面是我要做
的
事:data = pd.DataFrame( 'b' : [23,45,62,24,45,34,25,62],通过
使用
以下代码,我设法计算了按列'b‘分组
的
'a’列
的
平均值
: data.
groupby
('b', as_index=False)['a']
浏览 0
提问于2018-11-20
得票数 3
回答已采纳
1
回答
如果我想得到
平均值
,但没有以前
的
数据点,如
何在
dataframe中删除
行
、
、
我有一个超过4000
行
的
数据帧,我正在根据原始数据帧计算另一个数据帧中1179
行
的
平均值
。如果在for循环中匹配之前客队或主队计数小于3,那么我想在第二个数据帧中删除
行
。home_score)我尝试了value_counts,但我没有得到正确
的
结果,因为它没有正确地放置,所以我只想知道将它
浏览 0
提问于2021-07-07
得票数 1
1
回答
如
何在
DataFrame中创建和
使用
新函数?
、
、
、
、
如
何在
我
的
DataFrame中创建新函数并
使用
这个新函数,以便在聚合时添加新列?从我
的
DataFrame中,我
获得
了“风向”和“温度”,对于这些列,我想将它聚合起来,并创建具有“风向”
平均值
和所有城市
的
值与
平均值
"aa“之间
的
差值以及”温度“
的
平均值
的
表。然而,在我
使用
函数"aa“
的
列中,我得到了0。问题出在哪里,你能给我写几
浏览 6
提问于2019-10-21
得票数 1
1
回答
熊猫:搜索大型数据
的
最快方法是什么?
熊猫新手问题:c_id c1 c20 15 1102 96 120做这件事最好
的
方法是什么?我按c_id对数据进行排序,然后将索引设置为:df = df.set_index('c_id')temp_df= df.loc[:0] 要解决这个问题,最快
的
方
浏览 2
提问于2017-05-26
得票数 0
回答已采纳
1
回答
“SeriesGroupBy”和“SeriesGroupBy”
的
实例之间不支持“>=”
、
我正在尝试通过比较按current_reveal分组
的
两个列值presses和num,在数据帧中创建一个新
的
列id。如果presses大于或等于num,我想在reveal中说'True‘。','2','2'], 'num': ['6',
浏览 0
提问于2020-12-23
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Excel新函数体系中称王的三大函数,你还不知道?
Python之数据聚合与分组运算
在Pandas中通过时间频率来汇总数据的三种常用方法
Python Pandas模块数据统计与分析常用方法
使用 pandas 进行高效数据分析
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券