前面给大家简单介绍了 ☞【R语言】R中的因子(factor) 今天我们来结合具体的例子给大家讲解一下因子在临床分组中的应用。 我们还是以TCGA数据中的CHOL(胆管癌)这套数据为例。...关于这套临床数据的下载可以参考 ☞如何从TCGA数据库下载RNAseq数据以及临床信息(一) 前面我们也给大家介绍过一些处理临床数据的小技巧 ☞【R语言】卡方检验和Fisher精确检验,复现临床paper...☞R生成临床信息统计表 ☞玩转TCGA临床信息 ☞TCGAbiolinks获取癌症临床信息 接下来我们先读入临床数据 #读取临床数据 clin=read.table("clinical.tsv...*","stage I/II",stage) #转换成因子 stage=factor(stage) stage 可以得到下面这个两分组的因子 方法二、直接使用factor函数 #删除组织病理学分期末尾的...参考资料: ☞【R语言】R中的因子(factor) ☞如何从TCGA数据库下载RNAseq数据以及临床信息(一) ☞【R语言】卡方检验和Fisher精确检验,复现临床paper ☞R生成临床信息统计表
一年前我写了一篇文章,关于在 R 中估计 GARCH(1, 1) 模型参数时遇到的问题。我记录了参数估计的行为(重点是 β ),以及使用 fGarch 计算这些估计值时发现的病态行为。...我在 R 社区呼吁帮助,包括通过 R Finance 邮件列表发送我的博客文章。 反馈没有让我感到失望。...RMetrics 套件包(包括 fGarch)由 ETH Zürich 的 Diethelm Würtz 教授维护。他在 2016 年的车祸中丧生。 Dr....我将探讨包支持的不同优化程序。我不会像我在第一篇文章中那样画图,这些图只是为了表明存在的问题及其严重性。相反,我将考察由不同优化程序生成的估计器的特性。...正如 Vivek Rao 在 R-SIG-Finance 邮件列表中所说,“最佳”估计是最大化似然函数(或等效地,对数似然函数)的估计,在上一篇文章中我忽略了检查对数似然函数值。
在撰写本文时,ggplot2涉及在CRAN上的超过2,000个包和其他地方的更多包!在包中使用ggplot2编程增加了几个约束,特别是如果你想将包提交给CRAN。...尤其是在R包中编程改变了从ggplot2引用函数的方式,以及在aes()和vars()中使用ggplot2的非标准求值的方式。...有时候在开发R包时为了保证正常运行,不得不将依赖包列入Depdens。...在包函数中使用 aes() 和 vars() 为了使用ggplot2创建图形,你很可能至少要使用一次aes()函数。如果你的图形使用了分面操作,你可能也会使用vars()用来指向绘图数据。...常规任务最佳实践 使用ggplot2可视化一个对象 ggplot2在包中通常用于可视化对象(例如,在一个plot()-风格的函数中)。
数据分组,根据数据分析对象的特征,按照一定的数值指标,把数据分析对象划分为不同的区间部分来研究,以揭示内在的联系和规律性; 在R中,我们常用ifelse函数来进行数据的分组,跟excel中的if函数是同一种用法..." "(20,40]" "(0,20]" "(60,80]" "(80,100]" [15] "(0,20]" > newData <- data.frame(data, level) 数据分组后的结果
lpSolve 包和运输问题 运输问题(transportation problem) 属于线性规划问题,可以根据模型按照线性规划的方式求解,但由于其特殊性,用常规的线性规划来求解并不是最有效的方法。...lpSolve 包和指派问题 指派问题(assignment problem) 属于0 - 1 整数规划,是一种特殊的整数规划问题。...R中,lpSolve包提供了函数lp.assign() 来求解标准指派问题,其用法如下: lp.assign(cost.mat,direction = "min", presolve = 0, compute.sens...在实际应用中,常会遇到各种非标准形式的指派问题,有时不能直接调用函数,处理方法是将它们化为标准形式(胡运权, 2007),然后再通过标准方法求解。...同运输问题一样,LINGO 在解决指派问题时,也必须通过各种命令建立数据集、模型、目标函数、约束函数等,比较繁琐,相比之下,R两三句代码就可以快速解决问题,较之LINGO 软件,的确方便快捷了许多。
这是一般做基因差异表达分析在使用t检验或者其他统计检验中常出现的一个问题。...之前我学习和自己分析时就遇到过,尝试使用判断的方式事先检查它是不是数据存在问题(这类数据明显不服从正态分布),可以使用正态性检验,或者直接判断是不是样本组内的数据是完全一样的,如果一样就不要这个了。...所遇到的问题: 分析两个样本之间是否存在差异,每个样本三个重复。现在用的是t.test,但有些样本三个重复的值一样(比如有0,0,0或者2,2,2之类的),想问下像这种数据应该用什么检验方法呢?...为什么出现这问题?如果解决?以下是我的回答: 数据是恒量是无法做t检验的,因为计算公式分母为0(不懂的看下统计量t的计算公式,一般标准差/标准误为分母,所以恒量是不能算的)。...,如果出问题,返回相应的NA,这样我们可以算完后再检查数据。
RMetrics 序列包的主要维护者 Diethelm Wuertz 在 2016 年死于车祸,目前的代码基本处于无维护状态。 我会看看这是否解决了这个问题。谢谢 Brian!...我们希望将我们的检验应用于检测 GARCH 模型中的结构性变化,这是金融时间序列中的常见模型。据我所知,用于 GARCH 模型估计和推断(以及其他工作)的“最新技术” R 包是 fGarch。...特别是,他强调了 garchFit() 使用了过时的方法(或至少它们的 R 实现)。他主张在社区中提高对优化问题的认识,并提高包的灵活性,而不仅仅是使用 optim() 提供的不同算法。...我在本文中强调的问题让我更加意识到选择在优化方法中的重要性。我最初的目标是编写一个函数,用于根据 GARCH 模型中的结构性变化执行统计检验。...我之前从未怀疑或质疑过统计软件的计算结果,甚至没有考虑过这个问题。今后在处理其他统计模型的参数估计问题时,务必首先用模拟数据检验一下相关软件的结果稳健性。
ChAMP 包提供了完整的分析illumina甲基化芯片的pipeline, 和普通的Bioconductor 包的安装一样,代码只有简单的两行 source("http://bioconductor.org.../biocLite.R") biocLite("ChAMP") 我用的电脑是windows 操作系统,64位的R-3.4.3,安装过程中除了网速较慢,花费一点时间安装之外,并没有出现任何的问题。...dll 文件就是windows操作系统下的动态链接库,在加载R包的过程中,如果这个R包有对应的动态链接库,那么就会加载进来。...解决方案就是设置环境变量R_MAX_NUM_DLLS, 不管是什么操作系统,R语言对应的环境变量都可以在.Renviron文件中进行设置。...("d:/Documents/.Renviron", mustWork = FALSE) 第一个参数为.Renviron文件的真实路径,然后在加载ChAMP包就可以了 >> Package version
本期作者:徐瑞龙 未经授权,严禁转载 本文承接《在 R 中估计 GARCH 参数存在的问题》 在之前的博客《在 R 中估计 GARCH 参数存在的问题》中,Curtis Miller 讨论了 fGarch...包和 tseries 包估计 GARCH(1, 1) 模型参数的稳定性问题,结果不容乐观。...本文承接之前的博客,继续讨论估计参数的稳定性,这次使用的是前文中提到,但没有详尽测试的 rugarch 包。...rugarch 包的使用 rugarch 包中负责估计 GARCH 模型参数的最主要函数是 ugarchfit,不过在调用该函数值前要用函数 ugarchspec 创建一个特殊对象,用来固定 GARCH...为了解决非大样本情况下估计的稳定性问题,有必要找到一种 bootstrap 方法,人为扩充现实问题中有限的样本量;或者借鉴机器学习的思路,对参数施加正则化约束。
下面的例子摘自慕课网:闭包-慕课网 闭包 在函数内部定义的函数和外部定义的函数是一样的,只是他们无法被外部访问: def g(): print 'g()...'...return g 像这种内层函数引用了外层函数的变量(参数也算变量),然后返回内层函数的情况,称为闭包(Closure)。...闭包的特点是返回的函数还引用了外层函数的局部变量,所以,要正确使用闭包,就要确保引用的局部变量在函数返回后不能变。...): def f(i): def g(): return i * i return g r...= f(i) fs.append(r) return fs f1, f2, f3 = count() print f1(), f2(), f3()
问题 你想知道包里有什么。 方案 在一个新的 R 会话中使用 search() 可以查看默认加载的包。...#> [19] "package:datasets" "package:methods" #> [21] "Autoloads" "package:base" 以下提供的函数能够列出包中的函数和对象...showPackageContents <- function(packageName) { # 获取特定包所有内容的列表 funlist <- objects(packageName)...= 0) funlist <- funlist[-idx] # 创建一个数据框保存数据 objectlist R_system_version R.home R.Version
最近在做一个V*P*N中间件的配置工作,在配置iptables的时候,当用户想删除EIP(即释放当前连接),发现使用iptables的相关命令会提示错误。...我就纳闷了,怎么会出现这个问题,按照官方的文档也有错? 官方文档地址 解决方法: 1....根据匹配规则删除 官方文档中采用的的 精确匹配删除 。所以你不能只制定一个筛选条件。...这种精确匹配删除的成功依赖的就是用户提供的所有match字段,target字段必须和内核中保存的一模一样,精确到字节级别的匹配。如果哪怕有一个字节不匹配,就会有二义性,删除失败。 3....但问题是无法在阻塞态的时候使用 == 但是可以重启一个单独的脚本运行 == python-iptables的官方文档 import
删除topic里面的数据 这里没有单独的清空数据的命令,这里要达到清空数据的目的只需要以下步骤: 一、如果当前topic没有使用过即没有传输过信息:可以彻底删除。...想要彻底删除topic数据要经过下面两个步骤: ①:删除topic,重新用创建topic语句进行创建topic ②:删除zookeeper中的consumer中的路径。...这里假设要删除的topic是test,kafka的zookeeper root为/kafka 删除kafka相关的数据目录 数据目录请参考目标机器上的kafka配置:server.properties...-> log.dirs=/var/kafka/log/tmp rm -r /var/kafka/log/tmp/test* 删除kafka topic ....另外被标记为marked for deletion的topic你可以在zookeeper客户端中通过命令获得:ls /admin/delete_topics/【topic name】,如果你删除了此处的
同一组数据分组 需求:一个 list 里可能会有出现一个用户多条数据的情况。要把多条用户数据合并成一条。 思路:将相同的数据中可以进行确认是相同的数据,拿来做分组的 key,这样保证不会重。...实际中使用,以用户数据为例,可能用户名和身份证号是不会变的,用这两个条件拼接起来。
这是《Bioconductor 中的 R 包安装教程》的第二篇,完整的文章可以点击阅读原文查阅。...安装新版本的 Bioconductor R 包 Bioconductor 是与特定版本的 R 绑定的,正常来说当 Bioconductor 的包都来自同一版本时,它们的效果最佳。...以 DiffBind 包为例,DiffBind==3.4.0 是基于 Bioconductor==3.14(对应 R-4.1)开发的;我们在 Bioconductor==3.13(对应 R-4.0)中执行...BiocInstaller 安装 我们以在 R-3.4(Bioconductor==3.6)中安装最新版本的 clusterProfiler 为例。...,我这里用的是清华大学的,第二行,设定 install.packages 从 CRAN 和 Bioconductor 中搜索包,其实你还可以让它支持比如 R-Forge 以及各种第三方的仓库。
标准中注册的声明 (建议但不强制使用) : iss: jwt签发者 sub: jwt所面向的用户 aud: 接收jwt的一方 exp: jwt的过期时间,这个过期时间必须要大于签发时间 nbf: 定义在什么时间之前...,这个签证信息由三部分组成: header (base64后的) payload (base64后的) secret 这个部分需要base64加密后的header和base64加密后的payload使用....连接组成的字符串,然后通过header中声明的加密方式进行加盐secret组合加密,然后就构成了jwt的第三部分。...虎符CTF的WEB(easy_login) 该题开始是一个登录框,经过随意注册一个用户后,再进行登录后提示没有权限登录,这一点我们直接就可以猜测出是要求admin用户登录,然后我们在注册处利用BP抓包放包后可以看到有一串...所以可以想到JWT的伪造,同时结合题目的描述与node有关,学习到node 的JWT库的空加密缺陷问题。对普通用户的JWT进行base64解码如下 ? ?
Python大数据分析 ❝本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes ❞ 1 简介 我们在使用...pandas分析处理时间序列数据时,经常需要对原始时间粒度下的数据,按照不同的时间粒度进行分组聚合运算,譬如基于每个交易日的股票收盘价,计算每个月的最低和最高收盘价。...图1 2 在pandas中进行时间分组聚合 在pandas中根据具体任务场景的不同,对时间序列进行分组聚合可通过以下两类方式实现: 2.1 利用resample()对时序数据进行分组聚合 resample...原始的意思是「重采样」,可分为「上采样」与「下采样」,而我们通常情况下使用的都是「下采样」,也就是从高频的数据中按照一定规则计算出更低频的数据,就像我们一开始说的对每日数据按月汇总那样。...如果你熟悉pandas中的groupby()分组运算,那么你就可以很快地理解resample()的使用方式,它本质上就是在对时间序列数据进行“分组”,最基础的参数为rule,用于设置按照何种方式进行重采样
问题的提出 有人问PostgreSQL数据库中刚刚删除的数据能否被恢复? 或更进一步,如果如要在一个事务中做了一系列的更新、删除、插入的操作后,把这个事务提交之后又后悔了,能否恢复到之前的状态?...因为PostgreSQL的多版本原理是旧数据并不删除: 对于删除数据的操作,只是把行上的xmax改成当前的事务id 对于更新操作,只是把原先行上xmax改成当前的事务id,并插入一个新行,而新行上的...)”,如果事务回滚,则把commit log中的事务状态改成“事务回滚(TRANSACTION_STATUS_ABORTED )” 所以从理论上说,只要把在commit log中刚提交事务状态从“TRANSACTION_STATUS_COMMITTED...所以如果作了删除数据的操作后,马上把数据库停下来,这时autovacuum进程还没有把旧版本的数据给清理掉时,数据是可以恢复的。 但仅仅是把commit log中的事务状态改一下,就能恢复数据吗?...使用这个工具可以清理表的数据文件中的t_infomask中的hint信息,在清理hint状态之前,先查看行上的t_maskinfo状态: ? 然后执行下面命令清除行上的hint状态: ?
request.getProtocol()); System.out.println("请求资源路径:"+request.getRequestURI()); System.out.println("请求的servlet
标规划问题及其数学模型 目标规划(goal programming) 是运筹学中的一个重要分支,它是为解决多目标决策问题而发展起来的一种数学方法。...可以证明,在模型2有解的情况下,可以将其化为只含有目标约束的目标规划问题,方法是给所有的绝对约束赋予足够高级别的优先因子,从这个角度来看,线性规划为目标规划的特殊情况,而目标规划则为线性规划的自然推广。...用goalprog包求解目标规划 R中,goalprog包 (Novomestky, 2008) 可以求解形式为模型(3) 的目标规划问题,核心函数为llgp(),用法如下: llgp(coefficients...例 某工厂生产两种产品,受到原材料供应和设备工时的限制,在单位利润等有关数据已知的条件下,要求制定一个获利最大的生产计划,具体数据见表在决策时,按重要程度的先后顺序,要考虑如下意见: 1.原材料严重短缺...该模型符合模型 (3) 的形式,可以直接调用 llgp() 函数来求解该问题,注意:R中根据achievements数据框中的 priority 来判断绝对优先级别,不用再设置 P1,P2,P3。
领取专属 10元无门槛券
手把手带您无忧上云