首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言第二章数据处理⑥dplyr包(1)选取目录选取

在某些情况下,我添加了一个glimpse()语句,允许您查看输出tibble中选择,而不必每次都打印所有数据。...选取:基础部分 如果目的是选择其中几列,只需在select语句中添加的名称即可。...如果你想添加很多,可以通过使用:提高工作效率,取消选择甚至取消选择并重新添加它来进行选择。...另一种方法是通过在列名称前添加减号来取消选择。 还可以通过此操作取消选择某些。...甚至可以取消所有,然后重新添加其中某。下面的示例代码取消选择从name到awake的所有,但重新添加'conservation',即使它是取消选择的一部分。

1.2K21
您找到你想要的搜索结果了吗?
是的
没有找到

R语言第二章数据处理①选择

主要介绍几个基于 tidyverse 的函数: select():将一或多提取为数据表。 它还可用于从数据框中删除。 select_if():根据特定条件选择。...例如可以使用此函数选择,如果它是数字。...辅助函数 - starts_with(),ends_with(),contains(),matches(),one_of():根据名称选择/变量 根据的位置选择或者根据的名字选择 #选择第一到第三...) my_data %>% select(Sepal.Length:Petal.Length) 还有其他函数同样可以用于选择,包括根据首字母,尾字母,包含某字符,或者根据该的属性选择 # Select...#选择属性为数字的 my_data %>% select_if(is.numeric) 删除(根据的属性) #Removing Sepal.Length and Petal.Length columns

2K20

csvtk:高效命令行版极简dplyr

文本信息类 headers 打印首行(列名) dim 查看文件的行列数 ,和 R 中的 dim 类似 + summary 对所选进行简单的描述性统计,如果是统计内容是数字,则类似于 R 中的 summary...+ 格式转化类 pretty 可以让 csv 变成漂亮的对齐易读表格 + transpose 类似于 R 中的 t() 对数据进行转置 csv2json 则可以让数据转换为 json 格式 csv2md...head 查看文件开始若干行 concat 合并文件,类似于 cat 但是可以按照列名进行匹配合并 sample 按照比例对文本进行提取 cut 按照选择,支持数和列名,支持反选和模糊选择 + uniq...collapse 按照所选字段的 key 合并其它字段 + 文本编辑类 如果你熟悉 R 中的 dplyr,这类型的子命令中有不少都会让你感觉熟悉。...+ mutate 对某一进行正则表达处理增加新的一 mutate2 对多进行 awk 类似的字符和数学表达式处理,增加新 + gather 类似于 dplyr 中的 gather() 函数,数据

3.6K60

R 数据整理(七:使用tidyr和dplyr处理数据框 2.0)

dplyr 包的 distinct() 函数可以对数据框指定若干变 量,然后筛选出所有不同值,每组不同值仅保留一行。...=TRUE,默认distinct 只会返回选定的。...忽略最后一个即表示选择倒数第二个。 2.6 arrange 按照数据框里的某或某几列,对所有行进行排序。可以使用 desc 产生倒序,或写入多个使其按照多个进行排序。...有时候,需要将数据框先转换为宽列表,再转换回长列表,比如: 这个数据的问题是 x, y 应该放在两中却合并成一个了,2018 和 2019 应该放在一中却分成了两。...R 数据整理(六:根据分类新增列的种种方法 1.0) 其他函数 slice dplyr 包的函数 slice(.data, ...) 可以用来选择指定序号的行子集,正的序号表示保留,负的序号表示排除。

10.8K30

tidyverse:R语言中相当于python中pandas+matplotlib的存在

出版有《R for Data Science》(中文版《R数据科学》),这本书详细介绍了tidyverse的使用方法。...02 — tibble:高级数据框(data.frame升级版) ——数据()类型一目了然 tibble是R语言中一个用来替换data.frame类型的扩展的数据框,tibble继承了data.frame...:数据整理 dplyr包的下述五个函数用法 4.1 筛选: filter 4.2 排列: arrange 4.3 选择: select 4.4 变形: mutate 4.5 汇总: summarise...4.6 分组: group_by # install.packages("dplyr") library(dplyr) 4.1 筛选: filter() #按给定的逻辑判断筛选出符合要求的子数据集...#key:将原数据框中的所有赋给一个新变量key #value:将原数据框中的所有值赋给一个新变量value #…:可以指定哪些聚到同一中 #na.rm:是否删除缺失值 widedata <-

3.9K10

懒癌必备-dplyr和data.table让你的数据分析事半功倍

接下来,我就为大家分享几个我在工作当中最常用来做数据分析用到的包,dplyr和data.table,我保证你get到这两个包,就再也不想用R里面自带的基础包函数进行数据分析了!!...我工作当中,或者是公认的最常用的方法,无非就是下面几种: ① 数据过滤 ② 数据选择 ③ 数据排序 ④ 数据转换 ⑤ 数据分组 ⑥ 数据抽样 大家做数据分析,会发现90%的时间都在与这几个打交道...select(df,V1,V2,V3) 选择V1,V2,V3数据 select(df,V1:V3) 选择V1到V3所有数据 t<-select(df,-c(V1,V3)) 选择除了V1,...V3以外的所有 distinct( ) 去重 distinct(df,V1,V2) 根据V1和V2两个条件来进行去重 在基础包里面也有一个去重函数unique() ※注意distinct()可以针对某些进行去重..."B")] 使用j DT[,v1] #选择v1 那如果我要选择呢,大家注意一下这里不是用c()来选取了, 而是通过.()来选取,注意前面有一个”.”号,所以我说data.table的语法有点奇怪呢

2.4K70

Rdplyr 列式计算

❝在近期使用 「dplyr」 进行多选择性操作,如 mutate_at() 时,发现文档提示一系列的 「dplyr」 函数变体已经过期,看来后续要退休了,使用 across() 是它们的统一替代品,所以最近抽时间针对性的学习和翻译下...原文来自 [dplyr 文档](Column-wise operations • dplyr (tidyverse.org "dplyr 文档")) - 2021-01❞ 同时对数据框的多执行相同的函数操作经常有用...最后我们将简要介绍一下历史,说明为什么我们更喜欢 across() 而不是一种方法(即 _if(), _at(), _all() 变体函数)以及如何将你的旧代码转换为新的语法实现。...载入包: library(dplyr, warn.conflicts = FALSE) 基本用法 across() 有两个主要的参数: 第一个参数是 .cols ,它用来选择你想要操作的。...这是由 base R 提供的,但它并没有很好的文档,我们花了一段时间才发现它是有用的,而不仅仅是理论上的好奇。 我们可以使用数据框让汇总函数返回多

2.4K10

R&Python Data Science 系列:数据处理(1)

这一部分介绍一下R和Python数据处理用到的筛选、衍生以及计算函数。主要介绍如何使用R语言和Python中的两个程序包进行数据处理,R语言中的dplyr和Python中的dfply第三方包。...注意Python与R语言中有点不同,Python中使用X记录了每一步的结果,当需要选择结果中的的是需要使用X,而R语言则不需要这个中间变量。...R语言实现 ##选择cut和price,取最后5行 diamonds %>% select(cut, price) %>% tail(5) ?...c的; everything():所有。...,这里需要注意的是,查看某列有几个唯一值,python中需要先select()函数选择这一,然后再使用distinct,或者先distinct,再使用select;若直接使用distinct,则所有全部输出

1.6K10

R语言第二章数据处理⑤数据框的转化和计算目录正文

正文 本篇描述了如何计算R中的数据框并将其添加到数据框中。一般使用dplyr R包中以下R函数: Mutate():计算新变量并将其添加到数据表中。 它保留了现有的变量。...Mutate_at()/ transmutate_at():将函数应用于使用字符向量选择的特定 Mutate_if()/ transmutate_if():将函数应用于使用返回TRUE的谓词函数选择...转换特定 mutate_at():转换按名称选择的特定: my_data2 %>% mutate_at( c("Sepal.Length", "Petal.Width"),...funs(cm = ./2.54) ) mutate_if():转换由谓词函数选择的特定。...# 将所有因子转化成字符 my_data %>% mutate_if(is.factor, as.character) # 将左右数字四舍五入 my_data %>% mutate_if(is.numeric

4.1K20

数据清洗与管理之dplyr、tidyr

本期回顾 R语言 | 第一部分:数据预处理 R语言|第2讲:生成数据 R语言常用的数据输入与输出方法 | 第三讲 本期目录 0 二维数组行列引用 1 创建新变量 2 变量重新编码 3 变量重新命名 4...缺失值 5 dplyr包的下述五个函数用法 5.1 筛选: filter 5.2 排列: arrange 5.3 选择: select 5.4 变形: mutate 5.5 汇总: summarise...:unit 6.4 将一分离为多:separat 正 文 先前已经讲过R语言生成测试数据、数据预处理和外部数据输入等内容,但这仅仅是第一步,我们还需要对数据集进行筛选、缺失值处理等操作,以便获得可以应用于建模或者可视化的数据集...类似excel透视表反向操作 #gather(data, key, value, …, na.rm = FALSE, convert = FALSE) #data:需要被转换的宽形表 #key:将原数据框中的所有赋给一个新变量...key #value:将原数据框中的所有值赋给一个新变量value #…:可以指定哪些聚到同一中 #na.rm:是否删除缺失值 widedata <- data.frame(person=c('Alex

1.8K40

使用R或者Python编程语言完成Excel的基础操作

增加数据 插入行或:右键点击行号或标,选择“插入”。 输入数据:直接在单元格中输入数据。 2. 删除数据 删除行或:右键点击行号或标,选择“删除”。...筛选特定数据:在头上的筛选下拉菜单中选择要显示的数据。 7. 高级查询 使用高级筛选:在“数据”选项卡中选择“高级”,根据条件进行数据筛选。...在R编程语言中 处理表格数据通常依赖于dplyr和tidyr这样的包,它们提供了强大的数据操作功能。以下是一些基础操作在R中的实现方式,以及一个实战案例。...R代码 # 读取数据 sales <- read.csv("sales_data.csv") # 将日期转换为日期类型 sales$Date <- as.Date(sales$Date) # 转换为每月总销售额...通过dplyr和tidyr包,我们可以轻松地对数据进行复杂的操作。 在R语言中,即使不使用dplyr和tidyr这样的现代包,也可以使用基础包中的函数来完成数据操作。

13710

5R语言综合运用

R语言中,select函数用于选择数据框中的,可以使用列名或者向量来指定要选择。...例如,若要选择数据框df中的x和y,可以使用以下代码:library(dplyr),df <- select(df, x, y),filter函数用于筛选数据框中的行,它接受一个逻辑条件作为参数,返回符合条件的行...这两个函数都用于将字符串转换为小写字母,但是它们有以下区别:库依赖:str_to_lower()需要先安装和加载stringr包,而tolower()是R的内置函数,不需要任何额外的库。...tail(sort(x),5) 1 0.7370797 0.7998363 1.3085763 1.5950895 2.1714762 ```r #思考2,挑出一个表达矩阵里方差最大的1000个基因,转换为数据框取...load("test2.Rdata") class(test)#矩阵 1 "matrix" "array" ```r z <- as.data.frame(test)#转换为数据框 z <- mutate

2.3K00
领券