groupby
是 pandas 库中的一个功能,用于将数据分组,以便对每个组应用聚合函数,如均值、求和等。在处理数据时,经常需要对数据进行分组并计算每组的统计信息。
按单列分组、按多列分组、按条件分组等。
假设我们有一个 DataFrame df
,包含以下列:Region
、Product
、Sales
。
import pandas as pd
# 创建示例数据
data = {
'Region': ['North', 'North', 'South', 'South', 'East', 'East'],
'Product': ['A', 'B', 'A', 'B', 'A', 'B'],
'Sales': [100, 200, 150, 250, 120, 180]
}
df = pd.DataFrame(data)
# 按 Region 和 Product 分组,计算 Sales 的均值
grouped_df = df.groupby(['Region', 'Product'])['Sales'].mean().reset_index()
print(grouped_df)
groupby
方法按多列分组。dropna
方法在分组前去除空值。chunksize
参数分块处理数据。通过以上步骤和示例代码,你可以生成一个循环来查找多列的 groupby
均值。
领取专属 10元无门槛券
手把手带您无忧上云