data.table包提供了一个非常简洁的通用格式:DT[i,j,by],可以理解为:对于数据集DT,选取子集行i,通过by分组计算j。...(sum(Ozone,na.rm=T),sd(Ozone,na.rm=T))] #求和、求标准差操作
DT[,list(MySum=sum(v),...在data.table中有三类数据合并的方式:
1、直接用[]
data_one[data_two,nomatch=NA,mult="all"]
以第一个数据为基准,依据key进行合并,只出现重复部分...nomatch参数用于控制,当在i中没有到匹配数据的返回结果,默认为NA,也能设定为0。....SDcols常于.SD用在一起,他可以指定.SD中所包含的列,也就是对.SD取子集。