缺失值的分类
按照数据缺失机制可分为:
可忽略的缺失
完全随机缺失(missing completely at random, MCAR),所缺失的数据发生的概率既与已观察到的数据无关,也与未观察到的数据无关...),如果不完全变量中数据的缺失既依赖于完全变量又依赖于不完全变量本身,这种缺失即为不可忽略的缺失。...——User Guide for Pandas v-1.0
官方鼓励用户使用新的数据类型和缺失类型pd.NA
1、Nullable整形
对于该种类型而言,它与原来标记int上的符号区别在于首字母大写:'...插值
线性插值
1、索引无关的线性插值
默认状态下,interpolate会对缺失的值进行线性插值
s = pd.Series([1,10,15,-5,-2,np.nan,np.nan,28])
s...高级插值方法
此处的高级指的是与线性插值相比较,例如样条插值、多项式插值、阿基玛插值等(需要安装Scipy)。