新年伊始,开年热搜大戏“不知知网”带来支线剧情。趁着CNKI强势霸屏,基因研究媛仍然介绍“公共数据库和大规模计划笔记”系列第四篇“GTEx数据库”。
The Genotype–Tissue Expression (GTEx)计划目的是研究个人的基因组变异如何影响基因表达,导致生物学差异(人体组织和细胞的健康状态和患病状态)。人体组织来自尸检、器官捐献和组织移植项目的多种不同组织类型(包括大脑、肝脏和肺部)近千个体的不同人体组织。GTEx报告了组织之间和个体之间基因调控的重要差异,主要包括组织特异性的基因表达和鉴定许多组织中的基因表达水平的遗传关联(表达数量性状基因座eQTL)。eQTL有助于寻找基因之间和个体之间基因表达的差异。通过对不同的个体/人体组织的基因组和转录组进行测序来鉴定eQTL。GTEx数据主要用作eQTL分析,包括局部(cis-eQTL)和远端(trans-eQTL)效应,其转录组数据需向dbGAP申请。
Nature出版的GTEx collection
(https://www.nature.com/collections/dcfzxywzby),有相关的介绍和具体的数据分析方法。
GTEx数据的用途是什么:
大多数GWAS研究所得的相关变异与蛋白质编码变化无关,是非编码的,通过调控基因表达来影响功能。基因表达及其与遗传变异的关系是常见疾病的遗传基础,细胞环境是基因调控的关键决定因素。但在GTEx之前大部分表达数据来源于不同人、组织和细胞系的RNA-seq,没有大量同一人体的不同组织的基因表达数据。GTEx可以帮助研究同基因组变异如何影响个体组织、个体间甚至个体内基因的表达。
表达数量性状位点(eQTL)分析可以连接非编码区的变异和特定的基因/通路,从而理解疾病/性状相关变异的功能及鉴定疾病相关的基因。另外,也可以把人类基因表达的数量性状基因座(eQTL)和其他分子表型连接起来进行分析。
GTEx数据如何分析:
2015年GTEx计划发表了一篇论文“The Genotype-Tissue Expression (GTEx) pilot analysis: Multitissue generegulation in humans”,这篇文章详细描述了GTEx数据的分析手段,包括:
(1)Single-tissue eQTL analysis、(2)Multitissuejoint discovery of eQTLs、(3)Allele-specific expression analysis、(4)splicingQTLs、 (5) Functional annotation of eQTLs in noncoding regions、(6) Gene networkinference within tissues using cross-individual expression variation、(7) Genenetwork inference within individuals using cross-tissue expression variation。其中(4)可变剪切研究逐渐变为一个RNA-seq的标准分析步骤,在一些多组学研究的文章中有应用。最近的TCGA Pancancer也专门有论文研究可变剪切在不同癌症中的普遍特性。
总结:
GTEx数据已经成为与GWAS数据配套的必不可少的公共数据,其作为表达谱分析数据能够被用作各类QTL分析,后续还有最新发布的eGTEx相关的内容介绍。
新年祝福,希望大家在“不知知网”时,也可以义正言辞的讲“知GTEx”鸭!(如需转载文章,请注明出处或在对应文章中留言联系作者,谢谢合作。)
参考文献:
Lonsdale J, Thomas J, SalvatoreM, et al. The genotype-tissue expression (GTEx) project[J]. Nature genetics,2013, 45(6): 580.
GTExConsortium. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissuegene regulation in humans[J]. Science, 2015, 348(6235): 648-660.
GTEx Consortium. Genetic effects on geneexpression across human tissues[J]. Nature, 2017, 550(7675): 204.
领取专属 10元无门槛券
私享最新 技术干货