在pandas Dataframe上获取多条件(按列)的平均值,可以使用DataFrame
的loc
方法结合条件筛选和mean
方法来实现。
首先,使用loc
方法筛选出满足多个条件的数据子集,然后对该子集使用mean
方法计算平均值。
以下是一个示例代码:
import pandas as pd
# 创建一个示例DataFrame
data = {'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10],
'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
# 获取满足多个条件的数据子集,并计算平均值
subset = df.loc[(df['A'] > 2) & (df['B'] < 9)] # 满足条件 A > 2 和 B < 9
mean_value = subset.mean()
print(mean_value)
输出结果为:
A 4.0
B 7.0
C 12.0
dtype: float64
上述代码中,我们首先创建了一个示例的DataFrame df
,然后使用loc
方法筛选出满足条件A > 2
和B < 9
的数据子集,存储在变量subset
中。最后,使用mean
方法计算subset
中每列的平均值,得到了包含平均值的Series对象mean_value
。
对于pandas Dataframe上获取多条件的平均值,可以使用类似的方法进行操作。根据实际需求,可以灵活地组合多个条件来筛选数据,并使用mean
方法计算平均值。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云