Pandas是一个开源的数据分析和数据处理工具,提供了丰富的数据结构和数据操作功能。其中的groupby函数可以用于按照指定的列对数据进行分组,并进行相应的聚合操作。
在使用groupby函数时,可以通过指定一个或多个列名作为参数,将数据按照这些列的值进行分组。分组后,可以对每个组进行各种聚合操作,如求和、计数、平均值等。
下面是一个示例代码,演示了如何使用groupby函数制作两列列表:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob'],
'Age': [25, 30, 35, 25, 30],
'Salary': [5000, 6000, 7000, 5000, 6000]}
df = pd.DataFrame(data)
# 使用groupby函数按照Name列进行分组,并计算每个分组的平均年龄和平均工资
result = df.groupby('Name').agg({'Age': 'mean', 'Salary': 'mean'})
# 将结果转换为两列列表
result_list = result.reset_index().values.tolist()
print(result_list)
运行以上代码,输出结果为:
[['Alice', 25.0, 5000.0], ['Bob', 30.0, 6000.0], ['Charlie', 35.0, 7000.0]]
在这个示例中,我们首先创建了一个包含姓名、年龄和工资的示例数据集。然后使用groupby函数按照姓名进行分组,并计算每个分组的平均年龄和平均工资。最后,将结果转换为两列列表,并打印输出。
Pandas官方文档中关于groupby函数的详细介绍和用法可以参考:Pandas官方文档 - groupby
领取专属 10元无门槛券
手把手带您无忧上云