Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >GEO2R:对GEO数据库中的数据进行差异分析

GEO2R:对GEO数据库中的数据进行差异分析

作者头像
生信修炼手册
发布于 2020-05-08 09:12:09
发布于 2020-05-08 09:12:09
5.5K0
举报
文章被收录于专栏:生信修炼手册生信修炼手册

欢迎关注”生信修炼手册”!

GEO数据库中的数据是公开的,很多的科研工作者会下载其中的数据自己去分析,其中差异表达分析是最常见的分析策略之一,为了方便大家更好的挖掘GEO中的数据,官网提供了一个工具GEO2R, 可以方便的进行差异分析。

从名字也可以看出,该工具实现的功能就是将GEO数据库中的数据导入到R语言中,然后进行差异分析,本质上是通过以下两个bioconductor上的R包实现的

  1. GEOquery
  2. limma

GEOquery用于自动下载GEO数据,并读取到R环境中;limma是一个经典的差异分析软件,用于执行差异分析。

一组样本在GEO数据库中用series表示,比如GSE25724, 包含了case和control两组样本,case组包含6个生物学重复,control组包含7个生物学重复,共13个样本,链接如下

https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE25724

在网页上可以看到GEO2R的按钮,点击这个按钮就可以进行分析了, 除了差异分析外,GEO2R还提供了一些简单的数据可视化功能。

1. Value distribution

该选项用箱线图展示所有样本中表达量的分布,结果示意如下

2. Profile graph

该选项用于展示某个探针/基因在所有样本中的分布,结果示意如下

点击Sample values, 可以看到对应的表达量值,示意如下

GEO2R进行差异分析的步骤如下

1. 定义样本分组

通过Define groups按钮定义样本分组,首先输入一个group的名字,然后选择对应的样本,示意如下

2. 参数调整

通过页面下方的Options菜单,可以调整差异分析时的参数,示意如下

第一个参数用于选择多重假设检验的P值校正算法,第二个参数表示是否对原始的表达量进行log转换,第三个参数调整最终结果中展示的对应的platfrom的注释信息,是基于客户提供的supplement file中的信息, 还是使用soft文件中的信息。

3. 执行

点击如下所示的Top 250按钮,执行差异分析。

结果示意如下,在页面上只显示最显著的250个差异基因

全部基因的结果可以通过Save all results导出,通过GEO2R, 可以在没有任何编程基础的情况下,顺序的完成差异分析。

·end·

—如果喜欢,快分享给你的朋友们吧—

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-12-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
GEO数据库使用教程及在线数据分析工具
NCBI Gene Expression Omnibus(GEO)作为各种高通量实验数据的公共存储库。这些数据包括基于单通道和双通道微阵列的实验,检测mRNA,基因组DNA和蛋白质丰度,以及非阵列技术,如基因表达系列分析(SAGE),质谱蛋白质组学数据和高通量测序数据。
DoubleHelix
2019/08/07
40.7K0
GEO数据库使用教程及在线数据分析工具
GEO2R差异表达分析软件
前两天我们对GEO数据库来了一个大致的介绍GEO数据集详细介绍GEO数据库介绍 (一)。我们对于目标数据集,我们做的第一个事情就是差异分析,来寻找有差异的结果。所有的表达芯片做的差异表达分析都是基于limma的算法来的。我们今天介绍的这个GEO2R也只是把这个算法更加方便使用了而已。
医学数据库百科
2020/06/15
1.2K0
GEO2R更新后可以分析bulk RNAseq
当然了,仅仅是做到这些还不够,我们还需要足够的资金支持,因为绝大部分网页工具的十几年如一日的维护推广和更新,也是不小的花销。相信大家应该是看到过无数的网页工具云平台如雨后春笋般出现和消失,这一点来说,由美国国立生物技术信息中心(NCBI)维护的一个公共数据库,用于存储和共享高通量基因表达数据的GEO(Gene Expression Omnibus)就是其中的佼佼者啦,它有一个在线分析工具GEO2R,用于比较两个或多个基因表达数据集,并识别在不同条件下表达显著差异的基因。用于快速的基因表达分析,研究人员可以使用它来比较不同实验条件下的基因表达差异,例如,疾病与对照组、不同治疗组之间的差异等。
生信技能树
2023/09/19
6650
GEO2R更新后可以分析bulk RNAseq
利用GEO2R在线进行DEG表达分析
GEO2R 是一个交互式网络工具,允许用户比较GEO系列中的两组或多组样品间鉴定在实验条件下差异表达的基因。GEO2R 使用 DESeq2 、GEOquery 和 limma 对 NCBI 计算的原始计数矩阵进行差异表达分析。生信技能树公众号就介绍过:作者仅提供了fpkm格式表达量矩阵的转录组测序数据集该如何重新分析呢
生信菜鸟团
2024/06/11
5720
利用GEO2R在线进行DEG表达分析
作者仅提供了fpkm格式表达量矩阵的转录组测序数据集该如何重新分析呢
研究者们在GEO数据库是有数据分享:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE182923
生信技能树
2024/06/08
4190
作者仅提供了fpkm格式表达量矩阵的转录组测序数据集该如何重新分析呢
GEO数据库的这个功能你知道吗
大家都想学单细胞转录组数据处理,可是如果你不会R语言,没玩过GEO数据库挖掘,没有这些背景知识点,你会学的很辛苦,所以这里接受大家的投稿带领大家一起学习R及bioconductor技能!!!
生信技能树jimmy
2020/03/27
1.5K0
两次差异分析结果交集需要有多大才算是一致呢
同样的实验设计的两个项目,尽管测序的都是肿瘤和正常组织的转录组,但结果非常不一,样可能有多种原因,其中一些常见的原因包括:
生信技能树
2023/09/19
6230
两次差异分析结果交集需要有多大才算是一致呢
这种作者只提供了每组多个重复样本合并后数据的怎么办
GSE65031 这个数据为小鼠肺组织样本,总共有4个分组为三个时间节点 + 一个对照,每个分组有5个样本,但是测序的时候呢同一个组别中的这五个样本的 RNA 进行了 pool,然后再测序。
生信技能树
2025/01/20
980
这种作者只提供了每组多个重复样本合并后数据的怎么办
芯片数据分析,so easy?
我最早接触的高通量数据就是RNA-seq,后来接触的也基本是高通量测序结果而不是芯片数据,因此我从来没有分析过一次芯片数据,而最近有一个学员在看生信技能树在腾讯课堂发布的课程GEO数据库表达芯片处理之R语言流程(阅读原文购买)遇到了问题问我请教,为了解决这个问题,我花了一个晚上时间学习这方面的分析。
生信技能树
2018/07/27
2.5K0
芯片数据分析,so easy?
生信技能树R作业答案-中级
ggpubr http://www.sthda.com/english/articles/24-ggpubr-publication-ready-plots/
Y大宽
2019/06/02
1.9K0
没有生物学重复的转录组差异分析如何挑选基因呢: 变化倍数与P值选谁?
2、没有生物学重复的时候 还有算法可以做差异分析吗?进而得到一个统计学显著性Pvalue值。
生信技能树
2024/12/27
2450
没有生物学重复的转录组差异分析如何挑选基因呢: 变化倍数与P值选谁?
GEO数据挖掘
箱型图不显示原始数据点,而是采用样本数据,根据四分位数用盒和线来显示值的范围。此外,它们用星号显示落在箱须之外的离群值
可乐同学与生信死磕到底
2024/04/08
2540
GEO数据库挖掘
输入数据是数值型矩阵/数据框,颜色的变化表示数值的大小。有相关性热图和差异基因热图。
叮当猫DDM
2023/07/16
7961
Learn R GEO
·上下五条线的意思 中间的又黑又粗的—中位数;上下两条线是最大值和最小值;方框的上下两条线是75%和25%(四分位数);在外面的点-离群点
用户10412487
2023/03/28
1.2K0
两个不同数据集:同一课题组同样的实验设计差异分析结果一致性却很差是为什么呢?
这个数据集包括了46例样本,35个 药物 non-responder 和 11 个 responder。
生信技能树
2025/02/05
1390
两个不同数据集:同一课题组同样的实验设计差异分析结果一致性却很差是为什么呢?
GEO数据库表达数据的提取以及limma包进行差异分析
关于GEO数据库认识和在线使用教程,参考文章:GEO数据库使用教程及在线数据分析工具。关于GEO数据库的R包:Bioconductor:GEOquery包,我们前面已经介绍,当然是官方案例,我们这里实战一下。
DoubleHelix
2020/06/24
19.3K13
GEO数据库表达数据的提取以及limma包进行差异分析
从零开始的异世界生信学习 GEO数据库数据挖掘--GEO代码-芯片数据分析-1
在列表中取子集后得到"ExpressionSet"结构数据,为"Biobase"包中的数据形式
用户10361520
2023/03/09
1.1K0
花了10多万的队列就只为了这一张图吗?
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE44861,
生信技能树
2024/12/27
740
花了10多万的队列就只为了这一张图吗?
IF10+杂志文章只用统计学显著的差异基因做GSEA就合理吗?
Figure 2. CIH aggravates fibrosis, inflammation, and lipid accumulation in hepatocytes with PAOA stimulation
生信技能树
2025/02/05
1040
IF10+杂志文章只用统计学显著的差异基因做GSEA就合理吗?
GEO数据库(一)
2、本地安装:从github官网上R包界面下载到本地,并放到当前工作目录下,使用如下命令:
祈祈
2023/04/26
1.3K0
推荐阅读
相关推荐
GEO数据库使用教程及在线数据分析工具
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档