在可视化前的数据处理技巧中,导入导出、长宽转换已经跟大家详细的介绍过了。
今天跟大大家分享数据集的合并与追加,并且这里根据所依赖函数的处理效率,给出诺干套解决方案。...接下来按照名相同与不同分两种情况介绍;
列名相同:
ID<-c(1,2,3,4)
name<-c("A","B","C","D")
score<-c(60,70,80,90)
student1的列名(ID)时,by参数可以省略(by="ID")
以上两个数据集中,authors和books中有相同属性的主字段(surname&name)但是主字段名称不同,这里需要给merge...(x,y,by=c("Name"="name"))
#(6)anti_join(x, y) :包含x中,不匹配y的行,结果为x的子集,与semi_join相反
data6<-anti_join(x,y)...,太烦人了)
第四:微软的最新商务智能应用——PowerBI(其中的PowerQuery、PowerPivot)
第五:第三方的效率插件(很多VBA大神写过这些办公插件,但是我就不爱用,多装一个,Excel