首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Day6——R包

思维导图安装和加载R包以dplyr函数为例options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) options(...test, Petal.Length, Petal.Width)vars 字符向量中的列...,select中不能直接使用字符向量筛选,需要使用one_of函数R语言中使用vars参数指定数据框中需要分析的字段索引范围在R语言中,我们经常需要对数据框进行分析和处理。...在进行数据分析时,有时我们只对数据框中的特定字段感兴趣,而不需要使用所有的字段。这时,我们可以使用vars参数来指定需要分析的字段索引范围,从而提取出感兴趣的字段进行后续操作。...vars参数是dply包中select函数的一个参数,它允许我们通过指定字段的索引范围来选择需要的字段。索引范围可以是一个连续的整数向量,也可以是一个布尔向量。

15910

一文看懂用R语言读取Excel、PDF和JSON文件(附代码)

dplyr则是用来将数据库中的数据保存到本地。...当使用pdf_text提取文档内容时,全部内容都被提取为一个字符串向量,每页的内容都被单独放置于一个字符串中。帮助文档的PDF格式一共包含5页,所以这里会得到一个长度为5的字符串向量。...:自动将嵌套的数据集转换成非嵌套的平面数据集 …:设置显示方法 首先以JSON常见的数组形式创建一个字符串向量,保存为example。...中括号代表数组的起始,双引号中代表值,值与值之间以逗号进行分隔,然后再用单引号将这一数组格式保存到字符串向量中。...因为example中的数组是按照JSON格式输入的,所以直接使用fromJSON函数即可。 在默认的参数设置下,可以得到一个包含4个值的R对象—字符串向量。

7.1K21
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    高效R编程

    ##1) 内在排序 因子可用于图形排序,通常read.csv()中自动转换为因子,我们一般options(stringsAsFactors = F),但是作者出于可移植性考虑不建议将这个放到.Rprofile...因子还比字符串稍微节约点空间。 Apply函数家族 可以看作是循环的替代,第一次听说eapply()独立环境,这个我们应该用不到。将一个函数应用到每行或每列。参数可以放在后面传递给函数。...lapply()与vapply()一致,dplyr::select()与dplyr::filter()也是.purr中是map_dbl()代替Map(),flatten_df()代替unlist()。...0.1406 0.78 10 test(1000) 0.00053 0.00062 0.24 0.001 0.0014 2.40 10 函数闭包 函数闭包可以提供更高级别的缓存,R中...windows需要使用Rtools: 或者修改R.environ文件中的R_COMPILE_PKGS设为正整数并指定从source安装 install.packages("ggplot2", type=

    1.3K30

    R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

    R 当中是split( ),*apply( ),aggregate( )…,以及plyr包 1、split函数 split( )的基本用法是:group <- split(X,f) 其中X 是待分组的向量...在base包里和split功能接近的函数有cut(对属性数据分划),strsplit(对字符串分划)以及subset(对向量,矩阵或数据框按给定条件取子集)等。...")],function(x) sum(x)) 4、subset()函数 利用subset()函数进行访问和选取数据框的数据更为灵活,subset函数将满足条件的向量、矩阵和数据框按子集的方式返回。...进一步地,data.table在某些情况下执行效率更高。(参考来源:R高效数据处理包dplyr和data.table,你选哪个?) ?...data.table比较简洁一步搞定,dplyr花了两步,不过也dplyr也可以通过%>%来实现一步搞定。%>%的功能是用于实现将一个函数的输出传递给下一个函数的第一个参数。

    20.9K32

    R语言数据集合并、数据增减、不等长合并

    数据选取与简单操作: which 返回一个向量中指定元素的索引 which.max 返回最大元素的索引 which.min 返回最小元素的索引 sample 随机在向量中抽取元素 subset 根据条件选取元素...3、paste函数 生成一长串字符向量。 paste(c("X","Y"),1:10,sep="") #"X”,"Y"是长度为2的字符向量,1:10 长度为10的向量。...命令是让这两个向量粘合在一起生成新的字符串向量,粘合后的新字符之间没有间隔。...相比来说,其他一些方法要好一些,有dplyr,sqldf中的union 5、sqldf包 利用SQL语句来写,进行数据合并,适合数据库熟悉的人,可参考: R语言︱ 数据库SQL-R连接与SQL语句执行...(RODBC、sqldf包) 二、数据增减 x=x[,-1] #这个就代表,删除了x数据集中第一列数据 或用dplyr包中的mutate函数 a=mutate(Hdma_dat,dou=2*survived

    13.6K12

    Day07 生信马拉松-数据整理中的R

    全文并非是对数据整理的实操整理,主要整理在数据整理/清洗中常用的R包介绍 library(tidyr) library(dplyr) library(stringr) library(tibble) 1...(x," ")) x2 = str_split(x," ")[[1]];x2 #向量长度仅为1,因此用[[1]] x2为字符型向量 ################################...#提取x中第5和第9位的字符串 str_sub(x,5,9) 1.4 字符检测 str_detect(x2,"h") # 第一个参数为向量名,第二个是检测的关键词 str_starts(x2,"T")...#判断x2中T开头的字符串,输出逻辑向量 str_ends(x2,"e") #判断x2中e结尾的字符串,输出逻辑向量 1.5 字符串替换 x2 str_replace(x2,"o","A") #每个元素里面只替换第一次出现的目标字符...") #列出工作目录下以.R结尾的文件 file.create("douhua.txt") #用代码创建文件 file.exists("douhua.txt") #某文件在工作目录下是否存在 file.remove

    23900

    《高效R语言编程》6--高效数据木匠

    这是本书最重要的一章,将涉及以下内容: 使用tidyr整理数据 使用dplyr处理数据 使用数据库 使用data.table处理数据 软件配置 library("tibble") library("tidyr...通常的数据清理是将非标准文本字符串转换成lubridate简介所描述的数据格式。vignette("lubridate") ? 整洁是个广泛的概念,也包括重构数据,以便有利于数据分析和建模。...使用变量名非标准化求值更高效,见R语言 dplyr传递参数_自由 平等~忠诚 奉献-CSDN博客[2]。只是函数名多了个下划线那么简单吗?...unlist()函数的作用,就是将list结构的数据,变成非list的数据,即将list数据变成字符串向量或者数字向量的形式。...这里建议不要把数据库密码和API密钥等放在命令中,而要放大.Renviron文件中。dbConnect()函数连接数据库,dbSendQuery()查询,dbFetch()加载到R中。

    1.9K20

    R语言的综合应用-1

    require(stringr))install.packages('stringr')library(stringr)一、字符串#1.检测字符串长度str_length(x)length(x) #这是向量的长度...例如 y=c("nihaoa 11","niyehaoa 22","zhangsongwen 33")向量:y字符串:一个引号内的所有东西 “nihaoa 11” 字符:引号内的单个字母/数字...#这是一个字符串x#2.字符串拆分str_split(x," ") #以空格为分割符号将字符串拆分开,这个函数输出的结果是一个列表x2 = str_split(x," ")[[1]];x2 #​y...xstr_remove(x," ")str_remove_all(x," ")二、数据框#1.arrange,数据框按照某一列排序library(dplyr)arrange(test, Sepal.Length...在R语言的世界里,没有赋值就是没有发生过。#补充select()、filter() 筛选列、行类似于之前的$,[]#管道符号(%>%),表示把前一步的运算结果传递给后一步的函数,不需要多次赋值。

    93200

    DAY6-学习R包

    安装和加载R包镜像设置使用R配置文件使用file.edit()编辑文件——输入file.edit('~/.Rprofile') options("repos" =c(CRAN="https://mirrors.tuna.tsinghua.edu.cn...install.packages(“包”)或BiocManager::install(“包”)install.packages("dplyr") 加载 library和require 使用一个R包需先安装再加载...library(dplyr)dplyr五个基础函数mutate(),新增列——mutate(test, new = Sepal.Length*Sepal.Width)要修改的数据框的名称将创建的新变量的名称将分配给新变量的值...test中名为Sepal.Length的一列按列名筛选select(test, Petal.Length, Petal.Width)选择字符向量中的列,select中不能直接使用字符向量筛选,需要使用one_of...%  summarise(mean(Sepal.Length), sd(Sepal.Length))count统计某列的unique值count(test,Species)dplyr处理关系数据(将2

    23830

    R数据框如何取交集

    你可以在查询miRNA靶基因的时候限定使用哪些预测软件(如下图红圈所示),这样得到的结果就是多个预测软件预测结果的交集。...那么我们怎么利用R代码来对miRNA预测结果取交集呢? 我们知道一般在R里,对向量取交集,直接用intersect函数就可以了。...下面给大家介绍三种对R数据框取交集的方法 方法一、我们将各列的信息合并成一个字符串,然后取交集 #将各列的信息用_连接起来 combine1=apply(df1,1,function(x) paste...(x,collapse = "_")) combine2=apply(df2,1,function(x) paste(x,collapse = "_")) #查看合并后的字符串向量1和字符串向量2的交集...包里的intersect函数 #加载dplyr包 library(dplyr) #直接利用dplyr包里面的intersect函数对数据框取交集 result2=intersect(df1,df2) #

    1.7K20

    5R语言综合运用

    (x)#字符串长度 ## [1] 42 length(x)#注释str_length(x) 是 stringr 包中的函数,用于计算一个字符串中的字符数(包括空格和标点符号)。...R语言中,select函数用于选择数据框中的列,可以使用列名或者向量来指定要选择的列。...这两个函数都用于将字符串转换为小写字母,但是它们有以下区别:库依赖:str_to_lower()需要先安装和加载stringr包,而tolower()是R的内置函数,不需要任何额外的库。...输入类型:str_to_lower()仅适用于字符向量或字符串标量,而tolower()可以应用于所有字符数据类型,例如字符向量、字符串标量、因子等。...%>% names() #注释在R语言中,head()和tail()函数用于查看数据框或向量的前几行或后几行。

    2.3K00

    R语言基础5(绘图基础)

    2、搜索画图代码 3、仿制示例数据 4、套代码,调整细节 玩转字符串 str_length() length()#向量里面元素的个数 str_split() str_sub(x,5,9)#提取5-9的元素...可用于向量取子集; str_replace(x,"o","a")#将x中的o替换为a,只替换出现的第一个o; str_replace(x,"o|s","a")#将x中的o或者s替换为a,只替换出现的第一个...o; str_replace_all(x,"o","a")#将x中的o替换为a,替换所有的o; str_remove(x," ")##将x中的第一个空格删除; str_remove_all(x," ")...3.管道符号传递,简洁明了 iris %>% select(-5) %>% as.matrix() %>% head(50) %>% pheatmap::pheatmap() ##将管道符前面所有的结果传递给后面的函数...") #列出工作目录下以.R结尾的文件 file.create("douhua.txt") #用代码创建文件 file.exists("douhua.txt") #某文件在工作目录下是否存在 file.remove

    35871

    R tips:使用!!来增加dplyr的可操作性

    R中代码的运行过程 在介绍!!运算符之前,有必要先了解一下R中的代码是如何运行的。 在R console中输入一个代码,R就会返回代码的结果。...这个瞬间的过程其实需要两个步骤和三个阶段: 代码 --解析-> 语句 --执行-> 结果 输入的是文本代码(code),R会首先解析成语句(R称之为expression),expression在R中是一个树状结构...一个代码在R console中是直接运行到结束的,如果想要获得其中间态:语句,可以使用expr函数来捕获它。...辅助dplyr完成编程工作 上面的例子中,之所以group_var不起作用,是因为dplyr直接将group_var当做变量名,然后去mtcars中寻找名字叫做group_var的列,这肯定是会报错的。...PS:对于ggplot2而言也是一样的,它的aes也是不能直接使用变量传入列名,如果想要使用赋值了字符串的变量来传值的话,可以如上述操作。 但是也有更简单的的办法,它是?

    2.5K31
    领券