在数据分析中,常常有这样的场景,需要对不同类别的数据,分别进行处理,然后再将处理之后的内容合并,作为结果输出。对于这样的场景,就需要借助灵活的groupby功能来处理。...,将分组处理的结果合并起来,形成一个新的数据
图示如下
?...汇总数据
transform方法返回一个和输入的原始数据相同尺寸的数据框,常用于在原始数据框的基础上增加新的一列分组统计数据,用法如下
>>> df = pd.DataFrame({'x':['a','...a','b','b','c','c'],'y':[2,4,0,5,5,10]})
>>> df
x y
0 a 2
1 a 4
2 b 0
3 b 5
4 c 5
5 c 10
# 输出结果的行数和输入的原始数据框相同...,在原始数据框的基础上添加汇总列
>>> df['mean_size'] = df.groupby('x').transform(lambda x:x.count())
>>> df
x y mean_size