在数据处理中,将数据框(DataFrame)中的相同列值分组,并将相同值的总和添加为新列的操作通常称为“分组聚合”(GroupBy Aggregation)。这是数据分析中的一个常见任务,用于汇总和总结数据。
常见的分组聚合操作包括:
假设我们有一个包含销售数据的DataFrame,如下所示:
import pandas as pd
# 创建示例数据框
data = {
'Category': ['A', 'B', 'A', 'B', 'A', 'C'],
'Sales': [100, 200, 150, 250, 300, 400]
}
df = pd.DataFrame(data)
我们可以使用Pandas库中的groupby
和agg
方法来实现分组聚合操作:
# 按Category分组,并计算每个分组的Sales总和
result = df.groupby('Category').agg({'Sales': 'sum'}).reset_index()
print(result)
输出结果将是:
Category Sales
0 A 550
1 B 450
2 C 400
groupby
方法按指定列分组,并使用agg
方法进行聚合操作。reset_index
方法。通过上述步骤和示例代码,你可以轻松实现数据框中的分组聚合操作,并添加新列来存储相同值的总和。
领取专属 10元无门槛券
手把手带您无忧上云