Pandas分组统计
本文介绍的是pandas库中如何实现数据的分组统计:
不去重的分组统计,类似SQL中统计次数
去重的分组统计,类型SQL的统计用户数,需要去重
模拟数据1
本文案例的数据使用的是...模拟数据2
数据
import pandas as pd
df = pd.DataFrame({
'group': [1, 1, 2, 3, 3, 3, 4],
'param': ['...a', 'a', 'b', np.nan, 'a', 'a', np.nan]
})
分组统计方法1
直接使用groupby函数和nunique方法:
?...分组统计方法2
整体方法说明:
?
分步骤解释:
1、找出数据不是null的值
?
2、统计para参数中的唯一值
?...from_records方法
下面记录pandas中from_records方法的使用:
参数
DataFrame.from_records(data, index=None, exclude=None