#unique函数通常用于去重:
unique(mydata$B) #对含有重复值得向量进行去重
dplyr::distinct(mydata,B) #...对含有重复值字段的数据框去重
?...---------
Python:
---------
#列表去重:
set(将列表元组化过滤重复数据)
M=[1,4,3,6,5,4,3,2,7,8]
list(set(M))
#数据框的去重:
import...mydata.dropna(how="all",axis=1) #丢弃含有缺失值的行或者列
#缺失值填充:
fillna函数一共两个参数:
value表示要插补的值
method表示缺失值插补方法
myserie.fillna...(针对pandas中的序列和数据框)
缺失值处理:
nansum/nanmean/nanmin/nanmax
isnull
dropna
fillna