Pandas 是一个强大的 Python 数据分析库,提供了大量的数据结构和数据分析工具。按年份对数据进行分组,并根据多个列给出排名,通常涉及到以下几个概念:
假设我们有一个包含年份、部门、销售额的数据集 df
,我们希望按年份分组,并根据部门和销售额给出排名。
import pandas as pd
# 创建示例数据
data = {
'Year': [2020, 2020, 2021, 2021],
'Department': ['A', 'B', 'A', 'B'],
'Sales': [100, 200, 150, 250]
}
df = pd.DataFrame(data)
# 按年份和部门分组,并根据销售额进行排名
df['Rank'] = df.groupby(['Year', 'Department'])['Sales'].rank(ascending=False)
print(df)
Year Department Sales Rank
0 2020 A 100 2.0
1 2020 B 200 1.0
2 2021 A 150 2.0
3 2021 B 250 1.0
groupby
方法按年份和部门分组。rank
方法对销售额进行排名。通过上述步骤和示例代码,你可以轻松实现按年份对数据进行分组,并根据多个列给出排名的需求。
领取专属 10元无门槛券
手把手带您无忧上云