groupby
是 pandas 库中的一个功能强大的方法,用于根据一个或多个列的值将数据分组。通过 groupby
,可以对每个组进行聚合操作,如求和、平均值、最大值、最小值等。
groupby
可以根据以下类型进行分组:
假设我们有一个 DataFrame df
,包含以下列:['A', 'B', 'C']
,我们希望按列 A
和 B
分组,并减去每组的平均值。
import pandas as pd
# 创建示例 DataFrame
data = {
'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
'C': [10, 20, 30, 40, 50, 60, 70, 80]
}
df = pd.DataFrame(data)
# 按列 A 和 B 分组,并减去每组的平均值
grouped = df.groupby(['A', 'B']).transform(lambda x: x - x.mean())
print(grouped)
A
、B
和 C
的 DataFrame。groupby(['A', 'B'])
按列 A
和 B
分组,然后使用 transform(lambda x: x - x.mean())
对每个组的列 C
减去该组的平均值。通过这种方式,你可以轻松地对数据进行分组并减去每组的平均值,从而进行更复杂的数据分析。
领取专属 10元无门槛券
手把手带您无忧上云