Python Pandas是一个强大的数据分析工具,而Dataframe是Pandas中的一个重要数据结构。要按年份分组并汇总表格中的多列,可以使用Pandas的groupby函数和agg函数来实现。
首先,需要导入Pandas库并读取数据表格。假设我们有一个名为df的Dataframe对象,包含以下列:年份(year)、月份(month)、销售额(sales)、利润(profit)和产品类别(category)。
import pandas as pd
# 读取数据表格
df = pd.read_csv('data.csv')
接下来,可以使用groupby函数按年份(year)进行分组,并使用agg函数对其他列进行汇总计算。假设我们想要计算每年的总销售额和总利润。
# 按年份分组并汇总销售额和利润
summary = df.groupby('year').agg({'sales': 'sum', 'profit': 'sum'})
上述代码将按年份分组,并对每个分组计算销售额和利润的总和。结果将存储在一个新的Dataframe对象summary中,其中包含年份(作为索引)、总销售额和总利润。
如果想要进一步了解Pandas的groupby和agg函数的详细用法,可以参考腾讯云的Pandas文档:Pandas文档。
总结:
领取专属 10元无门槛券
手把手带您无忧上云