在pandas中,多索引数据帧是指具有多个层级索引的数据框。要计算多索引数据帧中一列的平均值,可以使用groupby()
函数和mean()
函数。
首先,使用groupby()
函数按照需要计算平均值的列进行分组。然后,使用mean()
函数计算每个分组的平均值。
以下是一个示例代码:
import pandas as pd
# 创建一个多索引数据帧
data = {'A': [1, 2, 3, 4, 5, 6],
'B': [7, 8, 9, 10, 11, 12],
'C': [13, 14, 15, 16, 17, 18]}
index = pd.MultiIndex.from_tuples([('Group1', 'A'), ('Group1', 'B'), ('Group2', 'A'), ('Group2', 'B'), ('Group3', 'A'), ('Group3', 'B')])
df = pd.DataFrame(data, index=index)
# 计算列'C'的平均值
average = df.groupby(level=0)['C'].mean()
print(average)
输出结果为:
Group1 14.0
Group2 15.5
Group3 17.5
Name: C, dtype: float64
在这个例子中,我们创建了一个多索引数据帧df
,其中有三个分组(Group1、Group2和Group3),每个分组都有两列数据(A、B和C)。我们使用groupby()
函数按照第一层级索引进行分组,并使用mean()
函数计算每个分组的列'C'的平均值。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云