在保留所有原始数据的同时聚合pandas Dataframe,可以使用pandas库中的groupby函数来实现。groupby函数可以根据指定的列或多个列对数据进行分组,并对每个分组进行聚合操作。
以下是实现的步骤:
import pandas as pd
data = {'姓名': ['张三', '李四', '王五', '张三', '李四', '王五'],
'科目': ['数学', '数学', '数学', '英语', '英语', '英语'],
'分数': [80, 90, 85, 70, 75, 95]}
df = pd.DataFrame(data)
df_grouped = df.groupby('姓名').mean()
df['平均分'] = df_grouped['分数'].transform(lambda x: x)
这样,我们就在保留所有原始数据的同时,将每个学生的平均分数添加到了Dataframe中。
总结一下,以上是在保留所有原始数据的同时聚合pandas Dataframe的步骤。通过使用groupby函数进行分组和聚合,并使用transform函数将聚合结果广播回原始Dataframe,可以实现这个目标。
推荐的腾讯云相关产品:腾讯云数据库TDSQL、腾讯云数据分析TDW、腾讯云数据仓库CDW等产品可以帮助您在云上进行数据聚合和分析。
更多关于pandas的详细信息和使用方法,可以参考腾讯云文档中的介绍:pandas使用文档
领取专属 10元无门槛券
手把手带您无忧上云