使用pandas数据帧按多列分组并添加新列的方法如下:
import pandas as pd
# 读取数据到数据帧
df = pd.read_csv('data.csv')
groupby()
方法按多列进行分组,并使用agg()
方法对每个分组进行聚合操作:# 按多列分组并聚合
grouped = df.groupby(['列1', '列2']).agg({'列3': 'sum', '列4': 'mean'})
在上述代码中,['列1', '列2']
表示按照列1和列2进行分组,{'列3': 'sum', '列4': 'mean'}
表示对列3进行求和操作,对列4进行平均值操作。
# 添加新列到原始数据帧
df = df.merge(grouped, on=['列1', '列2'], how='left')
在上述代码中,on=['列1', '列2']
表示按照列1和列2进行合并,how='left'
表示左连接,将聚合结果添加为新列到原始数据帧中。
这样,就可以按多列分组并添加新列到pandas数据帧中了。
推荐的腾讯云相关产品:腾讯云数据库TencentDB、腾讯云云服务器CVM、腾讯云对象存储COS等。你可以通过访问腾讯云官方网站获取更多关于这些产品的详细信息和介绍。
领取专属 10元无门槛券
手把手带您无忧上云