加权基因共表达网络分析 (WGCNA, Weighted correlation network analysis)是用来描述不同样品之间基因关联模式的系统生物学方法,可以用来鉴定高度协同变化的基因集,...测试数据下载地址:https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/FemaleLiver-Data.zip...", "stringr", "reshape2"), repos="https://mirrors.tuna.tsinghua.edu.cn/CRAN") library(WGCNA) options(...stringsAsFactors = FALSE); #开多线程,但是Mac上似乎这一步会报错,可不做 enableWGCNAThreads() library(WGCNA); options(stringsAsFactors...image.png 参考: http://blog.genesino.com/2018/04/wgcna/#wgcna%E5%9F%BA%E6%9C%AC%E6%A6%82%E5%BF%B5 https
本文采用WGCNA官网的Tutirial 1的数据,对加权基因共表达网络分析和后续的数据挖掘的具体操作进行梳理, 数据可以从官网下载,示意图如下 ? 整个分析流程可以分为以下几个步骤 1....datExpr0) = names(femData)[-c(1:8)] 对于基因的表达量数据,需要进行过滤,对于基因而言,可以过滤缺失值或者低表达的基因,对于样本而言,如果该样本中基因缺失值很多,也需要过滤,WGCNA...在WGCNA中,对于基因定义了GS值,表征基因和表型之间的相关性,对于module而言,也可以用所有基因GS绝对值的平均数来表征该module与表型之间的相关性,代码如下 moduleColors =
这篇推文主要探讨下WGCNA如何处理分类性状。...之前已经演示过WGCNA实战了:WGCNA实战:识别免疫相关lncRNA eigengenes可以代表某个模块,在计算出模块的eigengenes后,下一步就是探索eigengenes和性状之间的关系,...(虽然很多文章中都这样用) 如果是有序多分类,比如治愈、好转、未愈,这种,可以变成数字1,2,3,或者变成因子型; 如果是无序多分类,那么此时需要使用WGCNA提供的函数进行处理。...假如我们有一个无序分类变量x,它有3组: library(WGCNA) x <- rep(c("A","B","C"), each = 3) x ## [1] "A" "A" "A" "B" "B"...比如,对于我们之前用过的datTraits这个性状数据,我们假设其中的stage和msi是无序多分类变量,然后对这两个变量进行转换: load(file = "../000files/<em>wgcna</em>-02-
WGCNA是一种从大量数据中挖掘module的算法,而这些module所包含的gene为一组表达模式类似或这说表达谱相似的基因,也就是相关或不相关。...而正相关还是负相关可以由WGCNA的参数进行设定,默认是既包括正相关又包括负相关。...WGCNA对基因间表达量的相关系数取n次幂,使得相关系数数值的分布逐渐符合无尺度分布,按gene表达模式进行分类,将模式相似的gene归一一个模块module,而不是一般的cluster,因此WGCNA...WGCNA通过软阈值避免这一问题。 网络的数学名称是图,图论中每一个节点node有一个概念,那就是度degree,一个点的度指的是图中该点所关联的边数edge。...WGCNA的详细流程 WGCNA关键模块和hub基因筛选
WGCNA 实操: 以下代码、数据主要参考官方教程 2.1 整理输入数据 关于WGCNA的输入数据要求,官方文档已经做说明,大致如下几点: (1)至少20个样本以上,越多越好; (2)可以过滤点低表达或者低方差的基因...(3)WGCNA最初用于芯片测序数据,也适用于RNA-seq数据。关于RNAseq标准化,由于不涉及到不同基因之间的比较,所有常规标准化方式都可以。...2.5 挑选模块Hub基因 关于模块的Hub基因,WGCNA并没有明确的筛选方法。...学徒作业癌症分子亚型特异性模块 其实WGCNA本身是对基因进行合理(加权共表达)的分组。...15个的,官方也并推荐WGCNA分析。
参考文章: 加权基因共表达网络分析(WGCNA)案例代码 诚意满满的WGCNA分析,不进来看看吗?...library(tibble) library(ggpubr) library(pheatmap) library(ComplexHeatmap) library(ggrepel) library(WGCNA...="", xlab="", cex.lab = 1.5, cex.axis = 1.5, cex.main = 2) dev.off() message(paste0("=========WGCNA
今天小编给大家分享一个构建共表达网络的神器,WGCNA 。 这个软件从2008年发表至今(截止到2019-05-20)已经被引用3899次。可见这个包多么受欢迎。...那么到底怎么使用WGCNA呢?今天小编就以例子实操,一步一步为大家进行介绍。 1.使用WGCNA,首先要准备数据。...操作命令均在当前文件夹,文件夹中有以下文件: (1) geneExp.txt (2) trait_use.txt library(WGCNA) data<-read.table("geneExp.txt
前面的推文给大家介绍了3种识别免疫相关lncRNA的方法:免疫相关lncRNA的识别 今天再给大家介绍下如何使用WGCNA识别免疫相关lncRNA,也算是WGCNA的实战教程。...WGCNA可以看做是一种筛选候选分子的方法,也可以是识别特定性状相关分子的方法,还可以看做是一种降维方法。 WGCNA的原理和入门教程我们就不讲了,大家自己学习一下,直接进入实操。...如果是分类数据需要都变成数值型(因子型也可,以后再专门讨论这个问题),其实WGCNA包中还介绍了其他方法,以后我们专门再写一篇推文比较下。...挑选软阈值 # 加载数据 rm(list = ls()) load(file = "wgcna-01-dataInput.rdata") 软阈值一般要求R^2在0.9以上,最小也要在0.8以上。...提取感兴趣的基因(lncRNA) 上面的几个步骤其实是WGCNA的核心步骤,剩下的其实都是基于上面这个结果的个性化分析。
GEO_加权共表达网络WGCNA1 前言WGCNA(Weighted Gene Co-Expression Network Analysis,即加权基因共表达网络分析)是一种用于分析基因表达数据的系统生物学方法...WGCNA的主要目的是识别基因表达数据中的共表达模块,并研究这些模块与外部样本特征(例如,疾病状态、临床特征等)之间的关系。...下面是chatgpt给出的更为通俗易通的解释WGCNA(加权基因共表达网络分析)是一种分析基因表达数据的方法,旨在发现一组基因是如何共同工作的。可以将其想象为一种找出基因之间“朋友圈”的方法。...以下是WGCNA的一些通俗描述:基本概念基因共表达:就像某些人经常一起活动,某些基因在不同条件下(如健康与疾病状态)也表现得相似。...library(WGCNA)library(tinyarray)load("Dat.Rdata")#exp = log2(geo$exp+1)boxplot(exp)#从这张图可以看出数据是取过log的
WGCNA的理论背景知识 WGCNA的详细分析流程 关键模块和hub基因筛选,在流程中并不可知 模块划分好后如何找到key module 1 由WGCNA得到的module都进行GO或KEGG,甚至...intramodular connectivity KIM = intramodularconnectivity(adjacency, moduleColors, scaleByMax= TRUE) 另外还有很多不基于WGCNA
上期【高阶】WGCNA共表达网络分析-让你的文章闪耀起来中,我们给大家讲解了WGCNA的基本理论和其中的一些基本的概念,很多同学已经迫不及待想要学习整个WGCNA的分析流程了。...我们比较了很多网络上的教程,发现大多数文章都是翻版WGCNA官网中的分析流程去做,并没有把WGCNA的精髓给讲清楚。而且很多文章把整个分析流程讲的异常繁琐,让很多同学看了就望而却步。...于是,我们决定在这篇文章中,通过一个简化的步骤把WGCNA给大家彻底讲透,让大家上手就能做。本文代码见文末,联系客服领取。 ? WGCNA的目的 ?...先给大家讲讲WGCNA的精髓,其实就一句话:关联表型和基因。WGCNA通过将基因进行分组(module),把基因模块和表型进行关联,实现了快速锁定核心基因的目的。 ? WGCNA的步骤 ?...WGCNA需要读入的数据有两个: 基因表达谱数据 样本表型数据 我们采用WGCNA的示例数据来给大家进行解读。
在WGCNA中,可以通过intramodularConnectivity函数计算连接度,用法如下 # 计算基因间的邻接值 ADJ1=abs(cor(datExpr,use="p"))^6#计算连接度 Alldegrees1...在WGCNA中,计算基因与module之间的MM值的代码如下 datKME = signedKME( datExpr, datME, outputColumnName="MM.")
前些天我布置了WGCNA的作业:下载GSE106292 数据集的 Excel表格如何读入R里面,做出作者文章中那样的图,但是收到的作业中,有好几个同学都是搞不清楚文中的WGCNA针对的5个分组到底是什么.../Rpackages/WGCNA/faq.html 文章中关于进行WGCNA之前的数据为TPM数据(如下图所示),根据一文看懂WGCNA 分析(2019更新版):如果是芯片数据,那么常规的归一化矩阵即可...') load('wgcna_input.Rdata') 得到的样本聚类树可以看到,没有明显的离群样本,因此不需要剔除离群样本。...image-20191106200122936 6.获得Power值 rm(list = ls()) library(WGCNA) load(file = 'wgcna_input.Rdata') datExpr...是因为在wgcna中,认为模块是tom重叠性基因高的基因,所以需要计算基因和基因之间的tom重叠性,从而判断哪些基因应该属于同一个模块,哪些基因不在同一个模块。
我在生信技能树多次写教程分享WGCNA的实战细节,见: 一文看懂WGCNA 分析(2019更新版) 通过WGCNA作者的测试数据来学习 重复一篇WGCNA分析的文章(代码版) 重复一篇WGCNA分析的文章...(解读版)(逆向收费读文献2019-19) 关键问题答疑:WGCNA的输入矩阵到底是什么格式 其中有一个是“老米”投稿:手把手10分文章WGCNA复现:小胶质细胞亚群在脑发育时髓鞘形成的作用 , 里面是有...再说,这个配色问题,跟WGCNA没有关系,是R语言技巧罢了。
在WGCNA中,对传统的相关系数进行乘方运算,用最终得到的值来表征基因间的相关性。在计算出这样的相关性统计量值之后,如何确定哪些基因是共表达的呢?...WGCNA的做法是聚类分析,聚类分析属于一种非监督的机器学习算法,通过聚类树,可以观察到哪些基因在聚类树中属于同一分支,属于同一分支的基因可以归为一类。...实际操作中,考虑到基因数目较多等情况,肯定需要算法来自动化的进行分类,WGCNA采用的是dynamicTreeCut这个R包。...在计算距离矩阵时,WGCNA采用了TOM这种统计量,该统计量可以表征网络中节点的相似性,计算公式如下 ?...上述的计算方法在WGCNA中都有对应的公式,代码如下 # 确定乘方运算中power的最佳取值 powers <- c(c(1:10), seq(from = 12, to=20, by=2))sft <
加权基因表达网络分析(Weighted gene co-expression network analysis, WGCNA),又叫权重基因共表达网络分析,其根本思想是根据基因表达模式的不同,挖掘出相似表达模式的基因...构建加权相关性基因网络软阈值的选择 WGCNA中对基因表达值之间的相关系数取n次幂,这是和普通聚类的最大不同,其直接结果是把基因间相关性的强弱的差异放大。...WGCNA提供几种相关性的算法,其中包括Pearson correlation(cor()函数)、Biweight mid-correlation(bicor()函数)、Spearman correlation...(cor(x, method=“spearman”)函数)本研究中采用WGCNA默认的Pearson相关,Pearson correlation计算快速,但对离群值敏感。...WGCNA给出了如何选择这个阈值的方法,其函数是pickSoftThreshold()。 2 加权共表达网络的构建和模块识别 一旦选择好了构建网络的β值,那么从网络构建到模块识别需要四个步骤。
WGCNA基本概念 加权基因共表达网络分析 (WGCNA, Weighted correlation network analysis)是用来描述不同样品之间基因关联模式的系统生物学方法,可以用来鉴定高度协同变化的基因集...理解WGCNA,需要先理解下面几个术语和它们在WGCNA中的定义。 共表达网络:定义为加权基因网络。点代表基因,边代表基因表达相关性。...WGCNA包实战 R包WGCNA是用于计算各种加权关联分析的功能集合,可用于网络构建,基因筛选,基因簇鉴定,拓扑特征计算,数据模拟和可视化等。...安装WGCNA WGCNA依赖的包比较多,bioconductor上的包需要自己安装,cran上依赖的包可以自动安装。通常在R中运行下面4条语句就可以完成WGCNA的安装。...", "stringr", "reshape2"), repos=site) WGCNA实战 实战采用的是官方提供的清理后的矩阵,原矩阵信息太多,容易给人误导,后台回复WGCNA 获取数据。
测试数据下载链接在:https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/SimulatedData.zip...在这样的测试数据里面很容易跟着作者的文档,一步步掌握WGCNA,文档步骤目录如下: Simulation of expression and trait data: PDF document, R script...在我https://github.com/jmzeng1314/my_WGCNA 展示的乳腺癌数据集,效果如下: ?...比如在我GitHub讲解的乳腺癌数据集是https://github.com/jmzeng1314/my_WGCNA 可以很清晰的看到不同乳腺癌压型有着不同相关性的基因模块。 ?...写在最后 WGCNA包的作者,精心设计的这个测试数据集,其实最重要的不是WGCNA流程,而是它背后所呈现的原理。 希望你能静下心来读一遍。
image.png 接下来利用差异表达基因做加权基因共表达网络(WGCNA) WGCNA分析用到的代码是我在腾讯课堂上购买的一门课程,课程内容是介绍WGCNA分析在植物上的应用的。...另外还有一大部分代码来自生信技能树公众号文章七步走纯R代码通过数据挖掘复现一篇实验文章(第七步WGCNA) #标准化基因表达矩阵,这一步是因为我之前尝试WGCNA分析的时候使用原始的counts会遇到报错...#提示输入数据不能为整数,我还不知道WGCNA应该用什么作为输入数据 expCPM<-cpm(rnaCounts, normalized.lib.sizes=TRUE) expCPM[1:3,1:3]...只选用差异表达基因做分析,我这么做事为了减小数据量,缩短运算时间 #我现在还不知道,只用差异表达基因与用完整的基因集有什么区别 expCPM<-expCPM[cg1,] dim(expCPM) library(WGCNA...image.png sft$powerEstimate setwd("WGCNA_example/") net = blockwiseModules( datExpr, power = sft$
领取专属 10元无门槛券
手把手带您无忧上云