前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >组合多个GSE数据集进行meta分析不妨先去冗余

组合多个GSE数据集进行meta分析不妨先去冗余

作者头像
生信技能树
发布于 2018-12-18 06:48:24
发布于 2018-12-18 06:48:24
1.8K0
举报
文章被收录于专栏:生信技能树生信技能树

发现一个工具,发表在 BMC Bioinformatics201415:323 https://doi.org/10.1186/1471-2105-15-323,很简单的设计,就是考虑到做多个GSE数据集的meta分析的人越来越多了,但是很多人都瞎搞,整合数据集的时候没有去冗余。

所以作者开发这个R包: DupChecker: a bioconductor package for checking high-throughput genomic data redundancy in meta-analysis

既然是R包,那么学习起来就很容易了。

meta分析都想做,结果第一步就失策,哈哈,反思一下!

我的领域最出名的GSE数据集的meta分析应该就是2011年的TNBC了,如下:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-11-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第五步-高级可视化)
1写在前面 前面我们用WGCNA分析完成了一系列的分析,聚类分割模块。🥰 随后进一步筛选,找到与我们感兴趣的表型或者临床特征相关的模块,而且进行了模块内部分析。😘 再然后是对感兴趣模块进行功能注释,了解模块的功能及涉及的潜在机制。🥳 本期主要是介绍一些可视化的方法,大家了解一下吧。🥰 2用到的包 rm(list = ls()) library(WGCNA) library(dplyr) 3示例数据 load("FemaleLiver-01-dataInput.RData") load("FemaleLiv
生信漫卷
2023/02/24
6350
🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第五步-高级可视化)
不同的GSE数据集有不同的临床信息,不同的分组技巧
Jimmy大神怎么说过,只有多做、多错,才能真正的掌握。所以下面通过几个实战来说明。
生信技能树
2019/11/11
9.6K0
🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第四步-模块的功能注释)
1写在前面 前面我们用WGCNA分析得到多个模块,其中有一些模块和我们感兴趣的表型或者临床特征是相关的。🥳 接着就是要做模块的富集分析了,帮助我们了解这些模块的基因都有哪些已知的功能,涉及到哪些通路,在哪些疾病中最为重要。🥰 现在这种做富集分析的包还是蛮多的,WGCNA包内也是内置了相关功能,不过首推的还是Y叔的clusterProfiler,在我心中真是YYDS。🫶 2用到的包 rm(list = ls()) library(WGCNA) library(tidyverse) library(cluste
生信漫卷
2023/02/24
5070
🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第四步-模块的功能注释)
🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第二步补充-大数据的网络构建与模块识别)
1写在前面 之前我们完成了WGCNA输入数据的清洗,网络构建和模块识别。😘 ---- 但这里我们的示例数据内所含有的基因其实是很少的,而在实际情况中,一个简单的测序可能就要包含上万个基因,这对大家的电脑无疑是不小的压力。🤒 在WGCNA的包内其实也提供了解决方案,基本思想是分级聚类。🧐 ---- 1️⃣ 首先,我们使用快速但相对粗糙的聚类方法,用于将基因预聚类成大小接近的模块,且不超过你所设定的基因最大值。😂 2️⃣ 然后我们分别在每个模块中执行完整的网络分析。🤠 3️⃣ 最后,合并特征基因高度相关的模块。
生信漫卷
2023/02/24
4830
🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第二步补充-大数据的网络构建与模块识别)
🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第一步-数据整理)
1写在前面 最近实在是忙的不行,根本没时间更新,一到家就只想睡觉。🥹 今天写个最近用到的分析方法,Weighted correlation network analysis (WGCNA),是非常经典的生信分析方法了,现在被引有9913次了,马上就要破万啦。😘 网上相关的教程也是不胜枚举,但多多少少是有些不尽人意的地方,有的少步骤,有的代码不全。😅 这里在仔细阅读了官方手册后,在这里和大家一起认真地step by step研究一下,查缺补漏吧。🥰 2用到的包 rm(list = ls()) librar
生信漫卷
2023/02/24
7740
🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第一步-数据整理)
irGSEA:基于秩次的单细胞基因集富集分析整合框架
许多Functional Class Scoring (FCS)方法,如GSEA, GSVA,PLAGE, addModuleScore, SCSE, Vision, VAM, gficf, pagoda2和Sargent,都会受数据集组成的影响,数据集组成的轻微变化将改变细胞的基因集富集分数。
生信技能树
2023/12/05
2.9K0
irGSEA:基于秩次的单细胞基因集富集分析整合框架
多个数据集整合神器-RobustRankAggreg包
比如发表在peerJ的BIOINFORMATICS AND GENOMICS的文章Identification of key candidate genes and biological pathways in bladder cancer 里面的:
生信技能树
2020/06/28
2.5K0
多个数据集整合神器-RobustRankAggreg包
🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第二步-网络构建与模块识别)
1写在前面 上期我们完成了WGCNA输入数据的清洗,然后进行了样本的聚类与异常值的剔除,总体来说是非常简单的。😘 这期我们继续完成WGCNA分析的第二步,网络构建和模块识别。🤒 2用到的包 rm(list = ls()) library(WGCNA) library(tidyverse) 3示例数据 load("FemaleLiver-01-dataInput.RData") 4软阈值 4.1 topology analysis 首先我们要进行soft thresholding power β的计算。🤒
生信漫卷
2023/02/24
6040
🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第二步-网络构建与模块识别)
TNBC数据分析-GSE76275-GPL570
五月份的学徒专注于GEO数据库里面的表达量芯片数据处理,主要的难点是表达量矩阵获取和探针的基因名字转换,合理的分组后就是标准的差异分析,富集分析。主要是参考我八年前的笔记:
生信技能树
2021/08/25
2.5K0
TNBC数据分析-GSE76275-GPL570
甲基化芯片的一般分析流程
同样的策略,我们也可以应用到其它领域的知识背景快速学习,比如我们的lncRNA系列,miRNA系列,现在我们一起学习一下甲基化吧。
生信技能树
2020/02/20
3.9K0
GEO多数据集联合分析-文献复现
文献题目:基于生物信息学的新型铁死亡基因生物标志物和免疫浸润谱在糖尿病肾病中的应用Huang, Y., & Yuan, X. (2024). Novel ferroptosis gene biomarkers and immune infiltration profiles in diabetic kidney disease via bioinformatics. FASEB journal : official publication of the Federation of American Societies for Experimental Biology, 38(2), e23421. https://doi.org/10.1096/fj.202301357RR. IF: 4.8 Q1
用户11008504
2024/05/11
3832
IMMUcan—肿瘤微环境单细胞数据库
简介:来自法国巴黎圣路易斯研究所的研究团队建立了一个综合肿瘤微环境数据库平台(IMMUcan,https://immucanscdb.vital-it.ch)。该平台基于大量的单细胞数据收集与整合分析,为挖掘肿瘤免疫微环境单细胞特点提供了便捷的工具。
生信技能树
2023/02/27
1.3K0
IMMUcan—肿瘤微环境单细胞数据库
🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第三步-模块与特征分析)
1写在前面 之前我们完成了WGCNA输入数据的清洗,网络构建和模块识别。😘 而且还介绍了如何对大型数据分级处理,有效地减少了内存的负担。😷 ---- 接着就是最重要的环节了,将不同module与表型或者临床特征相联系,进一步鉴定出有意义的module,并进行module内部的分析,筛选重要基因。🤒 不得不说,东西还是挺多的,而且非常重要,我们一起来试一下吧。🥰 2用到的包 rm(list = ls()) library(WGCNA) library(tidyverse) 3示例数据 load("Femal
生信漫卷
2023/02/24
5500
🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第三步-模块与特征分析)
单细胞数据挖掘比公共数据集原始文献发表更早是一种什么样的体验
如果你搜索它可以发现这个GSE130000数据集其实早在2020年8月21日 就公开了,而且我们的学徒还拿它练习过 : GSE130000 - GEO Accession viewer 2020年8月21日 — Series GSE130000 ; Summary, To understand the recurrence of ovarian cancer, we profiled 13369 single cells from 8 ovarian cancer samples, 进入GSE13000
生信技能树
2022/03/03
7080
单细胞数据挖掘比公共数据集原始文献发表更早是一种什么样的体验
BRCA分型之PAM50(逆向收费读文献2019-10)
2年前,考虑到科研路的艰难,我组建了文献阅读小组,广邀粉丝参与,从自身做起,开始学习及分享!感兴趣可以点击下面的链接跳转去了解详情:
生信技能树
2019/06/19
2.2K1
BRCA分型之PAM50(逆向收费读文献2019-10)
新秀mulea包能取代y叔的clusterProfiler包生物学功能富集分析吗?
mulea 超越了传统工具,通过整合广泛的本体论,包括基因本体论、通路、调控元件、基因组位置和蛋白质域,涵盖27个模型生物,覆盖来自16个数据库的22种本体论类型和各种标识符,结果在 ELTEbioinformatics/GMT_files_for_mulea GitHub 存储库和通过 muleaData ExperimentData Bioconductor 包中有879个文件可用。
生信技能树
2024/12/19
1420
新秀mulea包能取代y叔的clusterProfiler包生物学功能富集分析吗?
一个甲基化芯片数据被挖掘好几次(学徒作业)
很简单的设计,就是450K甲基化芯片:DCIS (n=40) and adjacent normal (n=15) ,另外的信息技术:Among 40 DCIS cases 13 later developed invasive disease
生信技能树
2020/10/26
9570
一个甲基化芯片数据被挖掘好几次(学徒作业)
m6A-Seq数据质量评估:trumpet包
前面我提到了有学员提问:新的ngs流程该如何学习之m6A学习大纲,所以我给了他优秀学员想要MeRIP-Seq/m6A-seq教程,但是他似乎是并没有主动给我投稿,不过我们的转录组授课讲师也感兴趣了这个技术,想丰富一下课程内容,所以开启了这个系列学习哈!
生信技能树
2021/02/03
1.6K0
m6A-Seq数据质量评估:trumpet包
TNBC数据分析-GSE27447-GPL6244
五月份的学徒专注于GEO数据库里面的表达量芯片数据处理,主要的难点是表达量矩阵获取和探针的基因名字转换,合理的分组后就是标准的差异分析,富集分析。主要是参考我八年前的笔记:
生信技能树
2021/08/25
2.7K0
TNBC数据分析-GSE27447-GPL6244
多个数据集的整合分析
文章的故事是从这句话开始的:prognostic gene signature by generating the differentially expressed mRNAs with P-value less than 0.001 and fold-change values of −2 to 2 between tumor and non-tumor samples in GSE15471, GSE28735, and GSE62452 datasets.
生信菜鸟团
2023/01/05
1.1K0
多个数据集的整合分析
推荐阅读
相关推荐
🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第五步-高级可视化)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档