在使用df.groupby
进行分组后,可以通过get_group
方法获取指定分组的数据。然而,get_group
方法返回的是该分组的数据,而不是初始行的索引。如果需要获取初始行的索引,可以使用groups
属性来获取分组后的索引信息。
具体步骤如下:
df.groupby
对DataFrame进行分组操作,指定分组的列名或者多个列名。groups
属性获取分组后的索引信息,它返回一个字典,其中键是分组的值,值是该分组对应的行索引。以下是一个示例代码:
import pandas as pd
# 创建示例DataFrame
data = {'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'two', 'two', 'one', 'two', 'one'],
'C': [1, 2, 3, 4, 5, 6, 7, 8]}
df = pd.DataFrame(data)
# 使用df.groupby进行分组
grouped = df.groupby(['A', 'B'])
# 获取分组后的索引信息
groups = grouped.groups
# 遍历字典,获取每个分组的初始行索引
for key, value in groups.items():
print("分组:", key)
print("初始行索引:", value[0])
输出结果如下:
分组: ('bar', 'one')
初始行索引: 1
分组: ('bar', 'two')
初始行索引: 3
分组: ('foo', 'one')
初始行索引: 0
分组: ('foo', 'two')
初始行索引: 2
在这个示例中,我们使用df.groupby(['A', 'B'])
对DataFrame进行分组,然后通过groups
属性获取分组后的索引信息。最后,我们遍历字典,获取每个分组的初始行索引。
领取专属 10元无门槛券
手把手带您无忧上云