首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据处理第2节:将列转换为正确的形状

使用ifelse(),首先指定一个逻辑语句,然后在语句返回“TRUE”时需要发生什么,最后如果它是“FALSE”则需要发生什么。...*mutate_at()要求你在vars()参数中指定要进行变异的列。 Mutate全部列 mutate_all()版本是最容易理解的,在清理数据时非常漂亮。...在动态创建函数时,通常需要一种方法来引用要替换的值:这是.符号。...通过使用mutate_if(),我们在管道中需要两个参数: 首先,它需要有关列的信息。 此信息必须是返回布尔值的函数。...如上所述,ifelse()采用逻辑表达式,然后如果表达式返回“TRUE”则该怎么办,最后当它返回“FALSE”时要做什么。

8.1K30

R语言 控制流:for、while、ifelse和自定义函数function

当ifelse()用于返回Date类型的对象时,返回值是numeric类型,而不是Date类型,这是因为返回值的class是由test表达式决定的。...当表达式(exp)匹配后续的参数名(即变量名)时,返回参数的值 #switch语法 switch(字符,参数名1='参数值2',参数名2='参数值2',……"其他") 示例 #当表达式(exp)匹配后续的参数名...(即变量名)时,返回参数的值 > t = "r" > switch(t,r='re',g='gr',b='bl',"error") [1] "re" #如果不匹配任何参数名,switch函数不返回任何值...,可以添加一个匿名的参数, #当表达式(exp)匹配不上任意一个命名参数时,switch函数将返回匿名参数的值: > t = "xs" > switch(t,r='re',g='gr',b='bl',"...,运行的代码块和返回值组成,函数名称是变量,参数是调用函数时需要传递的形式参数;代码块是由由大括号构成,是调用函数时需要执行的代码逻辑;R的函数不需要显式地使用return关键字明确返回值,R函数的计算的最后一个值将自动作为返回值

5K50
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R语言学习常用函数

    5的元素的位置,第3与第5是大于5的 [1] 3 5 2、subset()函数 subset()函数是返回符合条件的元素,但是会忽略NA值。...注意:条件应该为逻辑值,否则会报错 > x NA,10) #一个含有NA值的向量 > x[x>6] #用向量的索引查看下x>6的元素 [1] 7,NA,10 >subset(x,x...>6) [1]7,10 3、ifelse()函数 ifelse(x,a,b)函数判断元素x是否符合条件,如果符合,返回a,如果不符合返回b,其中x为逻辑值 > X <- 1:10 > Yifelse...replace = T参数设置为T(或TRUE),表示抽样是带放回的,即每次抽取一个元素后,该元素会被放回池中,因此下一次抽样时它仍有可能被再次抽取。...) : 将种类为'double'的参数强迫转化为逻辑值 2: In all(a1, a3) : 将种类为'double'的参数强迫转化为逻辑值 > identical(a1,a2) [1] TRUE >

    14410

    R数据科学|5.4内容介绍及习题解答

    上面ifelse()函数含义为:如果y小于3或y大于20,则y=NA,反之,y还是为原来值。...问题一 直方图如何处理缺失值?条形图如何处理缺失值?为什么会有这种区别? 解答 直方图:当计算每个箱中的观察数时,丢失的值被删除。请参阅警告信息。...在直方图中x需要是数值型的,stat_bin()按范围将观察结果分组到各个箱中。由于NA观测值的数值是未知的,它们不能被放置在特定的容器中,因此被丢弃。...条形图:在geom_bar()函数中NA被视为单独一类的数据,此函数要求x是一个离散的(分类的)变量,缺失的值类似于另一个类别。...解答 该命令在计算平均值和总和之前从原数据中删除NA值。

    2.4K30

    「Workshop」第十五期:热图

    简单介绍 pheatmap包中的pheatmap函数能够对输入数据进行 k-means聚类和层次聚类,但是数据的行数超过1000时无法进行聚类。 2....> pheatmap(test, cluster_row = FALSE) 参数需要设置布尔值,cluster_row = FALSE 即不对行聚类 K-means聚类 > pheatmap(test...as.hclust(dend) + } > pheatmap(test, clustering_callback = callback) 解决问题1:色块控制 很多情况下,我们需要直观的通过颜色去看,当数据呈现正负值范围内时...,在变量内部进行相关分析时,有一半数据冗余,但是矩阵形式只能通过test[upper.tri(test)] NA将冗余信息变成0,并不能够直接去除,似乎参数里也没有可以直接画上下三角热图的参数,还是可以画出上下三角的热图...) 但是这样有一个大BUG,就是数据本身还是存在的,而且要把去掉的三角矩阵部分变成白色色块对应的值。

    1.7K00

    17. R编程(三:运算符、控制语句、基本函数)

    ifelse 语句 ifelse 包含三个参数。条件句(返回逻辑值),yes(逻辑值TRUE返回结果),no(逻辑值FALSE 返回结果)。...(x>0,"+","-") # x大于0返回+,小于0返回- > y [1] "+" "-" "-" "-" "+" "+" "+" "+" "+" "-" 而由此也可见ifelse 中的条件句,其结果可以是一个逻辑值的向量...表示各种与 EXPR 可能输出值的绑定语句。当... 中的某个丛句与EXPR值相等时,便会输出丛句对应的值。因此switch 常用于for 循环的遍历打印。...在function中不设定参数 hello <- function(){ print("Hi there!")...★变量被函数调用后发生的变化只会发生在返回值上,而变量本身数值不变。即通过某个函数计算某变量,该变量本身数值并不会改变。” 使用函数 当一个代码需要重复使用三次及以上,就该考虑使用函数或者循环。

    81410

    Learn R 专题1-3

    ()函数 ifelse(x,yes,no) x:逻辑值或逻辑值向量; yes:逻辑值为T时的返回值; no:逻辑值为F时的返回值 i = 1 ifelse(i>0,"+","-") > ifelse...","tumor") [1] "tumor" "tumor" "tumor" "normal" "normal" "normal" -----注意:yes和no的位置一定不能反----- (3)当存在多个条件时...与其他人以及每次登录时)都 一样 exp = matrix(rnorm(18),ncol = 6) #18个随机数分布在六列里形成矩阵 exp = round(exp,2) #round() 取小数点后...#X 是数据框/矩阵名;MARGING为1表示行;为2表示列,FUN是函数 ;对x的每一行/列进行FUN这个函数;...用于写函数的参数 > test<- iris[1:6,1:4] > apply(test...> sapply(test,mean) x y z 34.5 33.5 28.5 > sapply(test,fivenum) #fivenum():返回五个数据:最小值、下四分位数

    1.5K00

    DESeq2差异分析及VST变换的探索

    首先构建DDS,需要提供3个参数,表达矩阵-直接使用我们的1行代码得到的表达矩阵即可,无需任何修改。colData是样本名和样本分组组成的数据框,design是包含分组信息的列。...做了有以下好处:减少内存占用,加快运行速度,画图时减少意外(表达量很低在组间没有差异可能画不出来)。...DEseq2不用在一开始指定,在提取结果时指定也可以,使用起来很方便: # 提取结果,如果你一开始没有用因子level限定组别顺序,这里可以限定 # 添加tidy=T,返回数据框 res NA NA NA NA NA # 按照p值排序 resOrdered <- res[order(res$pvalue...:标准流程 17.ChAMP分析甲基化数据:从β值矩阵开始的流程 18.ChAMP分析TCGA结直肠癌的甲基化数据!

    3.3K10

    GMSB文章九:微生物的相关关系组间波动

    函数是 ANCOMBC 包中的一个函数,用于在微生物组数据中进行线性相关性的稀疏估计。...以下是 secom_linear 函数的主要参数和它们的作用:data: 包含微生物组数据的列表。assay_name: 指定数据集中的哪个检测类型(如“counts”)。...max_p: 最大 p 值,用于多重测试校正。n_cl: 聚类的数量。函数会返回两个主要的结果对象:corr_th 和 corr_fl,分别代表阈值相关性矩阵和完整相关性矩阵。...以下是 secom_linear 函数的主要参数和它们的作用:data: 包含微生物组数据的列表。assay_name: 指定数据集中的哪个检测类型(如“counts”)。...max_p: 最大 p 值,用于多重测试校正。n_cl: 聚类的数量。函数会返回两个主要的结果对象:corr_th 和 corr_fl,分别代表阈值相关性矩阵和完整相关性矩阵。

    10210

    R语言︱逻辑运算

    、&&、||、xor 注意:运算符“逻辑与”和“逻辑或”存在两种形式,“&”和“|”作用在对象中的每一个元素上并且返回和比较次数相等长度的逻辑值;“&&”和“||”只作用在对象的第一个元素上。...这两者的使用与前者类似: > x <- c(T,T,F) > y <- c(F,T,F) > x|y [1] TRUE TRUE FALSE > x||y [1] TRUE 3、all()和any() 判断数据中是否存在...TRUE值, 其中all()是在全部为TURE时返回T,any是在存在任何一个TRUE时返回TRUE。...他们都还有另外一个参数,即是否删除NA值,即not available值。...na.rm 如: > all(x, na.rm=T) 4、其他 ifelse():二者择一 match,%in%:查找unique:找出互不相同的元素 which:找到真值下标集合duplicated:

    1.2K30

    科研猫小课堂:敲黑板!竞争风险模型应该如何分析?

    对于死亡率较高的老年人群,当存在竞争风险事件时,传统生存分析方法(Kaplan-Meier方法、logrank检验、Cox比例风险回归模型)会高估感兴趣疾病的风险,从而导致竞争风险偏差。...所谓竞争风险模型是对生存数据的多个潜在结果进行处理的一种分析方法。早在1999年,Fine和Gray就提出了部分分布的半参数比例风险模型,常用的终点指标是累积发生率函数(CIF)。...= na.omit, 5 gtol =1e-06, maxiter =10, 6 init, variance = TRUE) 您可以参考crr()函数帮助文档了解各个参数的详细说明。...这里应该注意的是,函数必须指定时间变量和结果变量,然后传入协变量矩阵或数据框。首先,定义进入模型的协变量,并将其定义为数据框。...因此,读者在选择统计方法时,应该进行更充分的评估和实验。 科研猫原创出品,任何形式转载,均需获授权 若您是读者,欢迎分享,无需授权 易法通律师事务所提供版权法律支持

    4K20

    生信代码:机器学习-训练模型

    数据分割 在构建预测模型的开始可以使用数据分割构建训练集和测试集,也可以在训练集中用于执行交叉验证或自举(bootstrapping),以评估模型。...trainCapAve)) / sd(trainCapAve) mean(testCapAveS) [1] -0.002154109 sd(testCapAveS) [1] 1.203646 将预测算法应用于测试集时必须使用在训练集中估计的参数...变换之后的分布较处理之前更像正态分布的钟形曲线,在0值处有大量分布,在正态Q-Q图显示的正态分布理论分位数与样本分位数关系中也可以体现,左下角的数据不在理想的45º斜线上。...仅查看设置为缺失值的数据,一部分值变异性更高;查看非缺失值的数据,变异性更小。 注意: ・训练集和测试集必须以相同方式进行预处理。...・应用于测试集时必须使用在训练集中估计的参数,测试集的转换可能使不完美的。

    1.4K21

    R语言 常见函数知识点梳理与解析 | 精选分析

    ) 5、complete.cases( ) 判断对象中是否数据完全 6、grep()找出所数据框中元素所在的列值(仅数据框中) 7、assign()通过变量名的字符串来赋值 8、 split()根据因子变量拆分数据框...dplyr、tidyr | 第4讲 R语言 控制流:for、while、ifelse和自定义函数function|第5讲 正 文 1、str() 显示数据集和变量类型,并简要展示数据集情况 > data...3 4 5 5、complete.cases( ) 判断对象中是否数据完全 complete.case()可以判断对象中是否数据完全,然后返回TRUE, FALSE。...这一函数在去除数据框中缺失值时很有用。...:求子集 seq,from:to,sequence:等差序列 rep:重复 NA:缺失值 NULL:空对象 sort,order,unique,rev:排序 unlist:展开列表 attr,attributes

    2.3K21

    「R」数据操作(一)

    比如选择满足特定条件的行,使用[]符号,第一个参数提供一个逻辑向量,第二个参数留空。 本文大部分的代码都是基于一组产品的虚拟数据。我们先将数据载入,然后学习怎么用不同的方法操作数据。 if(!...(用NA表示),很多时候我们不希望数据出现任何缺失值,因此需要某种办法处理它们。...> toy NaN NA NA 使用3个参数可以获取单元格中的值: mean_quality3["model", "Wood", "yes"] #> [1] 5 reshape2...例如下面数据包含两种产品不同日期的质量和耐久性的测试结果: toy_tests = read_csv("../.....可以看到数据中存在缺失值,有一种叫末次观测值结转法(LOCF)可以填补缺失值,当非缺失值后面紧跟一个缺失值时,就用该缺失值填补后面的缺失值,直到所有缺失值都被填满。

    1.9K10

    R语言实现 支持向量机

    我这里不打算讨论具体的算法,因为这些东西完全可以参阅july大神的《支持向量机通俗导论》,我们这里只是介绍遇到问题时的想法,以便分析数据时合理调用R中的函数。...在介绍R中函数的用法时,我们先简要介绍一下SVM的类型,以便我们更好地理解各个参数的设置。 ? 对于线性不可分时,加入松弛项,折衷考虑最小错分样本和最大分类间隔。...= na.omit) 主要参数说明: Formula:分类模型形式,在第二个表达式中使用的的x,y可以理解为y~x。...Data:数据集 Subset:可以指定数据集的一部分作为训练集 Na.action:缺失值处理,默认为删除数据条目 Scale:将数据标准化,中心化,使其均值为0,方差为1.默认自动执行。...我们拿测试数据来看: ?

    1K30
    领券