MultiIndex是Pandas库中的一个重要功能,它允许我们在数据分析和处理中使用多级索引。通过MultiIndex,我们可以在一个轴上拥有多个层次的索引,从而更灵活地组织和操作数据。
使用MultiIndex Pandas应用程序的步骤如下:
import pandas as pd
MultiIndex.from_arrays()
、MultiIndex.from_tuples()
或MultiIndex.from_product()
等方法来创建MultiIndex对象。这些方法允许我们从数组、元组或笛卡尔积中创建多级索引。# 从数组创建MultiIndex
arrays = [['A', 'A', 'B', 'B'], [1, 2, 1, 2]]
multi_index = pd.MultiIndex.from_arrays(arrays, names=('Letter', 'Number'))
# 从元组创建MultiIndex
tuples = [('A', 1), ('A', 2), ('B', 1), ('B', 2)]
multi_index = pd.MultiIndex.from_tuples(tuples, names=('Letter', 'Number'))
# 从笛卡尔积创建MultiIndex
levels = [['A', 'B'], [1, 2]]
multi_index = pd.MultiIndex.from_product(levels, names=('Letter', 'Number'))
data = {'Value': [1, 2, 3, 4]}
df = pd.DataFrame(data, index=multi_index)
# 根据索引查询数据
df.loc[('A', 1)] # 查询索引为('A', 1)的行数据
# 多级索引切片
df.loc['A'] # 查询索引为'A'的所有行数据
df.loc[('A', 1):('B', 1)] # 查询索引从('A', 1)到('B', 1)的所有行数据
# 多级索引排序
df.sort_index(level=['Letter', 'Number'], ascending=[True, False], inplace=True)
# 多级索引重置
df.reset_index(inplace=True)
领取专属 10元无门槛券
手把手带您无忧上云