首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言第二章数据处理⑥dplyr包(1)选取目录选取

在某些情况下,我添加了一个glimpse()语句,允许您查看输出tibble中选择,而不必每次都打印所有数据。...选取:基础部分 如果目的是选择其中几列,只需在select语句中添加的名称即可。...如果你想添加很多,可以通过使用:提高工作效率,取消选择甚至取消选择并重新添加它来进行选择。...另一种方法是通过在列名称前添加减号来取消选择。 还可以通过此操作取消选择某些。...甚至可以取消所有,然后重新添加其中某。下面的示例代码取消选择从name到awake的所有,但重新添加'conservation',即使它是取消选择的一部分。

1.2K21
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R语言第二章数据处理⑦dplyr包(2)处理目录列名

    根据预先确定的列名选择 还有另一个选项可以避免连续重新输入列名:one_of()。 您可以预先设置列名,然后在select()语句中通过将它们包装在one_of()中或使用!!运算符来引用它们。...deer Capreolus herbi Artiodactyla lc ## # ... with 73 more rows 根据数据类型选择...按逻辑表达式选择 实际上,select_if允许您根据任何逻辑函数进行选择,而不仅仅基于数据类型。 例如,可以选择平均值大于500的所有。...为避免错误,您还必须仅选择数字,您可以提前执行此操作以获得更简单的语法,也可以在同一行中执行。...您选择它们的顺序将决定最终的顺序。

    1.8K40

    R语言第二章数据处理①选择

    主要介绍几个基于 tidyverse 的函数: select():将一或多提取为数据表。 它还可用于从数据框中删除。 select_if():根据特定条件选择。...例如可以使用此函数选择,如果它是数字。...辅助函数 - starts_with(),ends_with(),contains(),matches(),one_of():根据名称选择/变量 根据的位置选择或者根据的名字选择 #选择第一到第三...#选择属性为数字的 my_data %>% select_if(is.numeric) 删除(根据的属性) #Removing Sepal.Length and Petal.Length columns...) #Removing all columns whose name starts with “Petal”: my_data %>% select(-starts_with("Petal")) 根据的位置删除

    2.1K20

    Day07 生信马拉松-数据整理中的R

    全文并非是对数据整理的实操整理,主要整理在数据整理/清洗中常用的R包介绍 library(tidyr) library(dplyr) library(stringr) library(tibble) 1...x str_remove(x," ") #只删除第一次出现的目标字符 str_remove_all(x," ") #删除全部目标字符 2.玩转data.frame--dplyr包 2.1 arrange...,数据框按照某一排序,实际参数不能加" " library(dplyr) arrange(test, Sepal.Length) #从小到大排序 arrange(test, desc(Sepal.Length...mutate,数据框新增一 test <- mutate(test, new = Sepal.Length * Sepal.Width) #R中的修改必须要赋值,赋值=没发生 test 2.4...连续步骤的不同方法 2.4.1 多次赋值,产生多个中间的变量 x1 = select(iris,-5) #"-5"为删除第5 x2 = as.matrix(x1) x3 = head(x2,50)

    23600

    R语言第二章数据处理④数据框排序和重命名目录

    目录 R语言第二章数据处理①选择 R语言第二章数据处理②选择R语言第二章数据处理③删除重复数据 R语言第二章数据处理④数据框排序和重命名 =============================...=================== 这一篇主要介绍如何通过一个或多个(即变量)的值对数据中的行进行重新排序。...您将学习如何轻松地: 使用R函数arrange()[dplyr包]按升序(从低到高)进行排序 使用arrange()结合函数desc()[dplyr package]以降序(从高到低)对行进行排序 library...:: rename()重命名列 将Sepal.Length重命名为sepal_length,将Sepal.Width重命名为sepal_width: my_data %>% rename...( sepal_length = Sepal.Length, sepal_width = Sepal.Width ) 使用Rbase函数重命名列 要将Sepal.Length

    1.5K50

    R语言筛选的方法--select

    我们知道,R语言学习,80%的时间都是在清洗数据,而选择合适的数据进行分析和处理也至关重要,如何选择合适的进行分析,你知道几种方法? 如何优雅高效的选择合适的,让我们一起来看一下吧。 1....使用R语言默认的方法:选择 这一种,当然是简单粗暴的方法,想要哪一,就把相关的号提取出来,形成一个向量,进行操作即可。...5.2 放到环境变量中 「推荐的方法:」 r$> select = dplyr::select r$> a3 = a2 %>% select(ID,F1,y1,y2,y3) 推荐在载入包时,将下面代码放在开头...library(tidyverse) select = dplyr::select 6. 提取h开头的 这里,用starts_with,会匹配开头为h的。...应有尽有,无所有。 re1 = fm %>% select(starts_with("h")) 7.

    7.8K30

    R语言第二章数据处理③删除重复数据目录总结

    R语言第二章数据处理③删除重复数据 ================================================ 这篇主要介绍如何在R中识别和删除重复数据。...主要用的到R base和dplyr函数: duplicated():用于识别重复的元素和 unique():用于提取唯一元素, distinct()[dplyr package]删除数据框中的重复行...包删除数据框中的重复行 函数distinct()[dplyr package]可用于仅保留数据帧中的唯一行。...根据所有删除重复的行(完全一样的观测值): my_data %>% distinct() 根据特定删除重复值 my_data %>% distinct(Sepal.Length, .keep_all...总结 根据一个或多个删除重复行:my_data%>%dplyr :: distinct(Sepal.Length) R base函数从向量和数据帧中提取唯一元素:unique(my_data) R基函数确定重复元素

    9.9K21

    数据处理|数据查重怎么办?去重,就这么办!

    数据清洗过程中的典型问题:数据分析|R-缺失值处理、数据分析|R-异常值处理和重复值处理,本次简单介绍一些R处理重复值的用法: 将符合目标的重复行全部删掉; 存在重复的行,根据需求保留一行 数据准备 使用...2)选择删除 A:删除某一存在重复的行 data2 <- data[!duplicated(data$ID_REF),] ? 删除了ID_REF存在重复的行,搞定!...删除了ID_REF和GSM74876均重复的行,Done! 择“优”录取 存在重复,但是不想完全删除,根据数据处理的目的保留一行。...library(dplyr) data4 % group_by(ID_REF) %>% summarise_all(mean) ?...表达量去重 芯片表达数据中,会存在一个基因多个探针的情况,此处选择在所有样本中表达量之和最大的探针。

    1.7K30

    生信学习-Day6-学习R

    ") library(dplyr) 测试的数据框: test <- irisc(1:2,51:52,101:102), 在R语言中,这行代码是对数据集 iris 进行子集选择的操作。...: (1)select(test,1)#选择第一 (2)select(test,c(1,5))#选择第一和第五;(3)select(test,Sepal.Length) 列名: (1)select...2.inner_join(test1, test2, by = "x")內连inner_join,取交集 在R中,inner_join(test1, test2, by = "x") 是一个使用 dplyr...by = 'x':指定要根据哪个进行匹配。在这里,使用x来进行匹配。 结果将是一个新的数据框,其中包含了test1中那些在test2中找到匹配项的行,而包含在test2中找不到匹配项的行。...y = test1:表示要与test1数据框进行anti-join操作,即从test2中删除与test1匹配的行。 by = 'x':指定要根据哪个进行匹配。在这里,使用x来进行匹配。

    20510

    tidyverse:R语言中相当于python中pandas+matplotlib的存在

    02 — tibble:高级数据框(data.frame升级版) ——数据()类型一目了然 tibble是R语言中一个用来替换data.frame类型的扩展的数据框,tibble继承了data.frame...:数据整理 dplyr包的下述五个函数用法 4.1 筛选: filter 4.2 排列: arrange 4.3 选择: select 4.4 变形: mutate 4.5 汇总: summarise...key #value:将原数据框中的所有值赋给一个新变量value #…:可以指定哪些聚到同一中 #na.rm:是否删除缺失值 widedata <- data.frame(person=c('Alex...,默认为下划线 #remove:是否删除被组合的 wideunite<-unite(widedata, col = information, person, grade, score, sep= "...:被拆分列的分隔符 #remove:是否<em>删除</em>被分割的<em>列</em> widesep <- separate(wideunite, information,c("person","grade","score"),

    4.1K10

    往前一步是优秀,退后一步是懵懂

    前面提到R语言授课时的超纲练习题,已经分享过两位优秀学员的答案。 系统学习+主动探索,是最舒适的入门学习方式!...超纲练习题超纲 下面继续来看优秀学员Dr.luka的分享: R语言超纲练习题 (生信技能树优秀学员Dr.luka) 数据挖掘(GEO,TCGA,单细胞)2022年6月场,快速了解一些生物信息学应用图表...#由于soft$GeneName和exp$ID内容相同,可以直接合并 #dplyr包inner_join()和base包merge()用法相近 #2.删除重复基因 exp_new <- exp_new...包(思路与上述相近) exp_max3 % #合并探针的信息 inner_join(anno,by="ID") %>% #去掉多余信息,select支持按列名和号同时选择...distinct(GeneName,.keep_all = T) %>% #GeneName转换为行名 column_to_rownames(var="GeneName") %>% #反向选择去掉平均值的那一

    64020

    dplyr-cli:在Linux Terminal上直接执行dplyr

    熟悉R的朋友都会知道, dplyr包是对原始的数据集进行清洗、整理以及变换的有力武器之一。但是其使用会局限于你需要有打开R/R studio或者通过R脚本来执行 dplyr。...dplyr-cli设计的初衷就是让我们能够方便快速的在不打开R的情况下,在命令行中运行 dplyr,处理csv的文件。...csv 执行dplyr命令,仅将输入数据作为CSV输出到stdout kable执行dplyr命令,而仅将输入数据作为 knitr::kable()格式字符串输出到stdout 其工作原理:dplyr-cli...选择名为 cyl的例,并输出前6行: ..../dplyr select --file mtcars.csv -c cyl | head -n 6 实例二:多个数据处理的参数的结合 创建名为 cyl2的新一,它的值为 cyl的两倍,再提取 cyl

    2.1K10
    领券