关于更为复杂的缺失值插补技术,因为涉及到一些比较深入的方法,这里暂且不呈现,仅对缺失值的描述和筛选做以上简单归总。...]
})
mydata.drop_duplicates()
#使用pandas提供的数据框去重函数drop_duplicates去重重复值。...pandas中的序列和数据框都有固定的缺失值检测、描述、差值方法:
myserie=pd.Series(["A","B",np.nan,"C"])
mydata=pd.DataFrame({
"A":[..."A","B","C","D","E","F"],
"B":[43,np.nan,56,67,np.nan,56]
})
#检测缺失值:
myserie.isnull()
mydata.isnull...(针对pandas中的序列和数据框)
缺失值处理:
nansum/nanmean/nanmin/nanmax
isnull
dropna
fillna