--MORE-->
背景:统计重复值
在一个Series数据中经常会出现重复值,我们需要提取这些不同的值并且分别计算它们的频数:
import numpy as np
import pandas as...Categorical对象
通过pandas.Categorical来生成
通过构造函数from_codes,前提是你必须先获得分类编码数据
# 方式1
df2["subject"] = df2[...height', 'subject', 'score', 'height']
Categories (3, object): ['height' < 'score' < 'subject']
上面的输出结果..., interval[float64]): [(-2.371, -0.717] < (-0.717, 0.106] < (0.106, 0.761] < (0.761, 3.249]]
可以看到上面的结果返回的值...中不同的类别都是它的一列,看下面的例子:
data4 = pd.Series(["col1","col2","col3","col4"] \* 2, dtype="category")
data4
0