Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >TCGA和GTEx数据库基因表达分析资源:GEPIA

TCGA和GTEx数据库基因表达分析资源:GEPIA

作者头像
作图丫
发布于 2022-03-29 03:28:00
发布于 2022-03-29 03:28:00
4K0
举报
文章被收录于专栏:作图丫作图丫

导语

GUIDE ╲

GEPIA (Gene Expression Profiling Interactive Analysis) web服务器是2017年推出的,是基于TCGA和GTEx数据库中肿瘤和正常样本进行基因表达分析的一个资源。今天向大家介绍一下更新和增强的GEPIA2版本,提供了更高的resolution和更多的功能。

数据库介绍

GEPIA2具有198 619种isoforms(功能上相似的蛋白质,具有相似但不完全相同的氨基酸序列,由不同基因编码,或由去除不同外显子的相同基因的RNA转录本编码)和84种癌症亚型,从基因水平扩展到转录本水平将基因表达量化,支持对特定癌症亚型的分析和亚型之间的比较。此外,GEPIA2采用了受单细胞测序研究启发的新的基因特征量化分析技术提供定制分析,用户可以上传自己的RNA-seq数据,并与TCGA和GTEx样本进行比较。还提供了一个用于批量处理的API,以及容易检索分析结果。更新后的web服务器可以通过http://gepia2.cancer pku.cn/公开访问。

使用方法

01

首页

02

表达分析

(1)General常规分析

输入基因后,会显示该基因相关的基因功能信息,当将鼠标点击到人体图,可以显示该基因在不同组织中的表达情况,还分别以散点图和箱式图的形式提供所有肿瘤样本和配对正常组织的基因表达谱,以及该基因的Isoforms信息和与其相似的基因。

(2)Differential Genes差异表达分析

结果展示:

(提供该图的下载)

(3)Expression DIY定制表达分析

小编在这里主要看了BRCA1基因在三个癌型中的差异表达情况

(4)Survival Analysis生存分析

(5)Isoform Details同种型情况

输出:

(6)Correlation Analysis相关性分析

(7)Simlar Genes Detection识别相似基因

这里的相似基因的识别似乎也是基于上述的相关性分析方法。这里得到的数据可以下载。

(8)Dimensionality Reduction降低维度

这部分是根据一组基因的表达对来自不同癌症类型和组织的样本进行主成分分析(PCA)降维。

03

定制分析

这一部分主要是用户要上传自己的数据来进行分析。

(1)Cancer Subtype Classifier癌症亚型分类

癌型分类器主要用RNA-seq数据进行预测。选择要测试的模型,会通过每个子类型的样本得到一个概率矩阵。要求上传的基因表达谱应该是带有Hugo基因名称的TPM值。该分类器基于python中sklearn包实现的朴素贝叶斯算法,经过一些修改(如特征选择)。警告:要选择上传的文件的正确癌症类型,否则会得到无意义的结果。

(2)Expression Comparison表达比较

可以上传文件并选择一种癌症类型进行比较。默认情况下,将根据所选癌症类型的中位数进行分位数标化。然后会话将保持,直到刷新窗口,因此可以多次输入一个基因,而无需重新上传文件。上传的基因表达谱应该是带有Hugo基因名称的TPM值。建议上传由XENA pipeline处理的表达文件,由GEPIA使用。

04

数据资源

这里展示了GEPIA2中可用的TCGA/GTEx数据量。在组织标本tab中,进行了肿瘤与正常的比较。有60,498个基因和198,619个isoforms。同时展示了每种癌症的不同亚型。

小编总结

GEPIA2不仅能够针对单基因的功能信息,还同时可以展示其在不同组织中的表达情况,以散点图和箱式图的形式提供所有肿瘤样本和配对正常组织的基因表达谱,以及该基因的Isoforms信息和识别与其相似的基因。除此之外,还能对配对基因进行相关性分析,对基因基于表达值分组进行生存分析。用户也可以上传自己的数据进行分析。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-11-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作图丫 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
GEPIA2详解(中国智造-肿瘤数据库)
GEPIA2 是北京大学张泽民老师实验室开发的一个网站,能够对TCGA和GTEx项目共9736个肿瘤样本、8587个正常样本的RNA-seq表达数据进行分析。目前该网站已经有两篇文章发表。
生信技能树
2020/03/31
12.6K0
TCGA数据库的normal样本不够可以拿GTEx来凑
其实是没办法简单的回答是否可以整合TCGA和GTEx数据库,或者说该如何结合,这背后的统计学略微有点复杂,不仅仅是批次效应。发表在Sci Data. 2018; 的文章:Unifying cancer and normal RNA sequencing data from different sources 就比较详细的说明了TCGA和GTEx数据库的转录组数据的天然差异:
生信技能树
2020/07/14
6.7K0
TCGA 联合 GTEX 分析流程
在我们使用 TCGA 数据进行差异分析的时候,可能会遇到肿瘤和正常数据之间的不平衡的问题。为了得到更科学的结果,结合 GTEx 项目提供的正常样本数据是一种较为常见的解决方法,因此本篇文章整理和运行了一种可行的数据下载和处理流程。
叶子Tenney
2024/08/25
6540
TCGA 联合 GTEX 分析流程
TCGA免疫浸润评价数据库
对于RNA-seq的数据,之前我们的分析方法只是局限于单个基因之间的整合分析,最多也就是做一下富集这样的聚类分析。前段时间随着肿瘤免疫的热度,也有人试着开始利用RNA-seq这样的数据来评价患者的免疫情况。
医学数据库百科
2020/07/14
1.8K0
GEPIA:点点鼠标就能分析TCGA数据
随着公共数据库的建立和开放,越来越多的研究者可以接触到测序数据,非常适合我们这种“三无”研究者(无课题,无经费,无文章)运用公共数据找点事情干,可以是另辟蹊径从某个独特的视角重新分析已有的数据发发文章,也可以在没钱做测序的情况下看看自己研究的基因在别人的数据里是什么样子,积攒一些研究基础。不过想玩转生信大数据,面前总是隔着一座计算机编程的高山,门槛太高让众多小白望而却步。
微点
2019/05/07
3.5K1
WGCNA分析+公共数据库挖掘你感兴趣的癌症
原文链接: Application of weighted gene co-expression network analysis to identify key modules and hub genes in oral squamous cell carcinoma tumorigenesis
生信技能树
2018/12/13
2.2K0
WGCNA分析+公共数据库挖掘你感兴趣的癌症
生物信息数据分析教程视频——07-TCGA数据库:基因的表达探索
视频地址:http://mpvideo.qpic.cn/0b2ewiaakaaahmalygztmbrvbmwdawzaabia.f10002.mp4? 参考文章: 【0代码】单基因泛癌分析教程 视频
DoubleHelix
2022/12/15
7240
GEPIA:TCGA和GTEx表达谱数据分析平台
GEPIA整合了来自TCGA和GTEx项目中的基因表达谱数据,提供了多种数据分析和可视化功能,操作简单,方便广大科研人员对肿瘤的表达谱数据进行挖掘,对应的文章发表在Nucleic Acids Research,链接如下
生信修炼手册
2019/12/19
1.4K0
lncRNAs和circRNAs数据分析,你需要这个神器
Lnc2Cancer 3.0由哈尔滨医科大学李霞老师和宁尚伟老师课题组开发,发表在2020年10月13日发表在Nucleic Acids Research杂志上。
百味科研芝士
2021/01/07
1.3K0
lncRNAs和circRNAs数据分析,你需要这个神器
基因表达可视化工具
目前,cBioPorta、GEPIA等现有生物学工具为基因表达分析提供了许多有用的可视化和分析工具,但是并不能充分解决实验生物学家要求的其他一些快速分析。例如,根据初步结果选择特定的细胞系进行进一步研究,从多个组织和细胞系的RNA水平和蛋白质水平以及磷酸化蛋白分析基因表达,可视化肿瘤与正常组织之间的miRNA表达等。今天,小编就来给大家介绍一个直观地定量,比较和可视化组织和细胞系中的基因表达的数据库:GEDS(http://bioinfo.life.hust.edu.cn/web/GEDS/),从mRNA,miRNA和蛋白质水平对基因表达进行定量。GEDS数据库整合了TCGA,GTEx,CCLE和MCLP4个数据库标准化的mRNA,miRNA和蛋白质表达数据。
医学数据库百科
2021/09/15
1.1K0
TCGAplot:用于TCGA多组学数据的泛癌分析和可视化R包
比如,最基础的也是最常见的一个癌症领域需求是说明为什么要在某疾病研究某个基因,其实就可以完完全全是使用TCGA数据库的公开信息,如下所示:
生信技能树
2023/12/20
6.5K0
TCGAplot:用于TCGA多组学数据的泛癌分析和可视化R包
TCGA蛋白分析数据库
功能蛋白质组学是对蛋白质在功能活性水平(例如表达和修饰)的大规模研究。对诸如癌症等复杂疾病的研究表明,遗传改变并不能说明该疾病的所有原因。蛋白质水平和结构的变化也已显示在肿瘤发展和进展中起关键作用,而遗传变化并未反映出这一点。在癌症中,疾病的发展通常需要几种遗传和表观遗传学改变。今天给大家介绍一个用于访问,可视化和分析患者肿瘤样本功能蛋白质组学的综合资源:TCPA(https://www.tcpaportal.org/)。
医学数据库百科
2021/07/28
4.2K0
选好基因,单基因泛癌发7分+也不难!
CDCA4(细胞分裂周期相关蛋白4)参与细胞周期调节,是癌症的潜在的生物标志物。
作图丫
2022/03/29
7730
选好基因,单基因泛癌发7分+也不难!
【生信文献200篇】17 单细胞转录组揭示韩国人乳腺癌病人异质性
英文标题:Single-cell analyses of transcriptional heterogeneity in squamous cell carcinoma of urinary bladder
生信菜鸟团
2021/03/04
8560
【生信文献200篇】17 单细胞转录组揭示韩国人乳腺癌病人异质性
TCIA数据库 : 不认识我?我哥是TCGA!
肿瘤免疫疗法在多种恶性肿瘤的临床治疗上取得了显著效果,然而还是存在大部分患者对于免疫疗法没有响应的问题。为了更好的理解肿瘤和免疫细胞相互作用,科学家对来自TCGA和其他几个大型肿瘤研究项目,共20种实体瘤的NGS数据进行分析。TCIA研究发表在Cell Rep(1区,IF9.423分)上:
用户6317549
2022/04/09
3.4K0
TCIA数据库 : 不认识我?我哥是TCGA!
TCGA、ICGC、GTEx 数据库都是啥?
我们在进行数据库介绍,尤其是肿瘤相关数据库的时候,经常会提到说这个使用了 TCGA/GTEx 数据库的数据,那么这两个数据库到底是什么呢?为什么会有用这两个数据库呢?另外呢,由于最近ICGC提的也比较多,所以这里也就做一下简单的介绍。
医学数据库百科
2020/07/16
5.1K0
学徒作业-单基因的tcga数据挖掘分析
最近在做一个0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》,直播活动,收集整理文献看到了一个很有意思的研究,节选文章里面的部分图表作为学徒作业哈!
生信技能树
2020/06/03
1.9K0
玩转 TCGA 数据库 - 转录组分析(二)
TCGA 数据库因有各种的癌症转录组数据,所以最基础的就是下载转录组数据,然后对不同样本根据表型做转录组分析。这里我们做一下实战。
生信菜鸟团
2025/05/13
390
玩转 TCGA 数据库 - 转录组分析(二)
对TCGA基因表达数据深入分析:UALCAN
UALCAN是一个全面的、用户友好的、交互式的web资源,用于分析癌症组学数据。
作图丫
2022/03/29
2.3K0
对TCGA基因表达数据深入分析:UALCAN
引出你的课题聚焦的基因-差异和生存
比如,一个课题是为了说明 BACE2 基因在癌症研究领域很重要,就可以使用两个数据库(TCGA and GTEx),做出差异和生存的图表来辅助自己的研究。
生信技能树
2020/08/07
7710
引出你的课题聚焦的基因-差异和生存
推荐阅读
相关推荐
GEPIA2详解(中国智造-肿瘤数据库)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档