新年伊始,开年热搜大戏“不知知网”主线剧情又见更新。趁着CNKI热度保持,基因研究媛不懈介绍“公共数据库和大规模计划笔记”系列第九篇“eGTEx数据库”。
继GTEx之后,eGTEx项目扩展了GTEx项目,将基因表达与相同组织上的其他中间分子测量相结合,通过分子表型来量化分子和细胞表型的层次。与GTEx使用的RNA-seq转录组相比,eGTEx项目计划研究端粒长度、DNA可及性、组蛋白修饰、DNA和RNA甲基化、体系和胚系突变、等位基因特异性表达和蛋白质定量表达。从QTL分析来讲,包括了Allele-specific expression QTLs(ase-QTLs)、Methylation QTLs (meQTLs)、protein QTLs(pQTLs)。具体的计划测序数据方案见下表:
与GTEx一样,eGTEx数据最大的用途是在多组学分析,计划论文中列举了如下所示的方法:
此外,eGTEx已经和ENCODE计划合作发展了ENTEx计划,由此也可以想到GTEx与ENCODE和Roadmap的数据集成。
总结:
与GTEx一样,eGTEx数据以QTL类处理方法为主,但可以和多种数据结合进行集成分析,初步的数据在GTEx官网还没公布。除了与GWAS数据结合,与蛋白质组和表观组的结合是一个可以发展的方向。上图(Box 1)列出的集成方法值得借鉴,适合结合公共数据进行多组学分析,在GTEx数据上也可以使用,但需要注意组织特异性的问题。
新年祝福,希望大家在“不知知网”时,也可以义正言辞的讲“知eGTEx”鸭!(如需转载文章,请注明出处或在对应文章中留言联系作者,谢谢合作。)
参考文献:
StrangerB E, Brigham L E, Hasz R, et al. Enhancing GTEx by bridging the gaps betweengenotype, gene expression, and disease[J]. Nature genetics, 2017, 49(12): 1664.
领取专属 10元无门槛券
私享最新 技术干货