options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
中科大源
install.packages(“R包名称”)
BiocManager::install(“R包名称”)
library()和require()
install.packages("dplyr")
library(dplyr)
test <- iris[c(1:2,51:52,101:102),]
mutate(test, new = Sepal.Length * Sepal.Width)
##新增列
select(test,1)
按列号筛选
select(test, Petal.Length, Petal.Width)
按列名筛选
filter(test, Species == "setosa")
filter(test, Species == "setosa"&Sepal.Length > 5
)
筛选行
按某1列或某几列对整个表格进行排序
arrange(test, Sepal.Length)
从小到大
arrange(test, desc(Sepal.Length))
从大到小
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))
平均值和标准差计算
管道操作 %>% (cmd/ctr + shift + M)
count统计某列的unique值:count(test,Species)
內连inner_join,取交集:inner_join(test1, test2, by = "x")
左连left_join:left_join(test1, test2, by = 'x')
全连full_join:full_join( test1, test2, by = 'x')
简单合并:bind_rows()
两个表格列数相同,bind_cols()
两个数据框有相同的行数
练习+理解,熟能生巧!
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。