首先,我要向大家道歉,文章标题有点夸大。如果想要用shinyGEO这个工具,还是需要一丢丢的R基础。这个基础包括
你的电脑里面要安装了R语言,因为shinyGEO是用R语言开发的~~
你要知道怎么运行R代码~~
GEO(Gene Expression Omnibus),即基因表达数据库,美国国立卫生研究院 NCBI 于 2000 年创建的公共数据库,具有强大的灵活性和开放性,用户可以提交、储存、检索和下载多种形式的数据。GEO 数据库是目前最大、最全面的公共基因表达数据资源。
这里我给大家介绍 shinyGEO,一款分析 GEO 中表达数据的软件。它并不需要太多的编程知识,用户只要电脑里有 R 语言,了解怎么运行 R 代码,就可以轻松愉快的进行 GEO 的数据分析啦~~
shinyGEO 简介
首先给出文章:
shinyGEO: a web-based application for analyzing gene expression omnibus datasets
该文章 2016 年发表在『Bioinformatics』上
shinyGEO 是基于 R 语言中的 shiny 包而制作的一个 web application。用户只需要提供 GEO 中的检索号,就可以通过 shinyGEO 下载表达谱数据,并对感兴趣的基因进行差异表达分析和生存分析,并生成高质量的图片,还提供分析的 R 语言代码。
shinyGEO 官网:http://gdancik.github.io/shinyGEO/
从上图可以看到,shinyGEO 有网页版和本地版,作者推荐使用本地版。实际上,我在尝试使用网页版时总是出错。
shinyGEO 安装
安装过程来自 https://github.com/gdancik/shinyGEO,用户只需要运行下面的代码就可以了。
运行上面的几行语句,就可以在本地打开 shinyGEO。
shinyGEO 示例介绍
我们就以文章中的 GSE13507 为例,介绍一下 shinyGEO 的用法
1. Differential Expression Analysis
这里,我想看看 tp53 基因在不同性别的患者中是否存在显著差异,操作及结果如下图所示。
点击『Save R Code』后,我们可以到『Code』栏中查看背后的 R 代码。
2. Survival Analysis
点击左侧边栏的『Survival Analysis』,选择 tp53 基因,然后点击按钮。
选择生存时间和结局,然后点击『Generate KM Plot』,绘制生存分析图。如果想对部分样本进行生存分析的话,需要点击『View Data Table』选取。
最终,如下图所示:
3. View Sample Data Table
以表格的形式展示数据。其中『Sample Selection』可以用于选择大样本中的一个子集,然后进行分析。
大家有时间的话一定要试一试,光说不练假把式。
有什么问题可以直接联系我~~~
领取专属 10元无门槛券
私享最新 技术干货