可以通过以下步骤实现:
from dplython import (DplyFrame, X, select, sift, group_by, summarize, head)
data = DplyFrame({'col1': [1, 2, 3, 1, 2, 3],
'col2': ['A', 'B', 'A', 'B', 'A', 'B']})
result = (data >>
group_by(X.col2) >>
summarize(count=X.col1.count()))
在上述代码中,通过group_by函数指定按照'col2'列进行分组,然后使用summarize函数计算每个分组中的行数,并将结果保存在'count'列中。
print(result)
输出结果为:
col2 count
0 A 3
1 B 3
这表示按照'col2'列分组后,'A'组有3行,'B'组也有3行。
推荐的腾讯云相关产品:腾讯云服务器CVM、云数据库CDB、腾讯云函数计算SCF。
领取专属 10元无门槛券
手把手带您无忧上云