数据的质量直接关乎最后数据分析出来的结果,如果数据有错误,在计算和统计后,结果也会有误。
所以在进行数据分析前,我们必须对数据进行清洗。...数据清洗也是一个迭代的过程,实际项目中可能需要不止一次地执行这些清洗操作。
缺省参数 nan
将元素只为None 则显示为缺省参数NaN
# 读取数据
file = '....|\$',np.nan,regex=True)#用np.nan替换?或.或$原字符
# df.replace([r'\?',r'\$'],np.nan,regex=True)#用np.nan替换?...,r'\$'],[np.nan,'NA'],regex=True)#用np.nan替换?用 NA替换$符号
# df.replace(regex={r'\?'...NaN时, 在写入文件时要添加设置缺省参数 na_rap = "NaN" 否则写入时会显示空白
# data.to_csv("frame.csv", na_rap = "NaN")