前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >基因的拷贝数,mRNA转录,和蛋白翻译水平相关性迷思

基因的拷贝数,mRNA转录,和蛋白翻译水平相关性迷思

作者头像
生信技能树
发布2023-02-27 20:55:12
发布2023-02-27 20:55:12
70700
代码可运行
举报
文章被收录于专栏:生信技能树生信技能树
运行总次数:0
代码可运行

TCGA计划大家应该是都不摸索,有多种癌症,多种数据类型,如下所示:

代码语言:javascript
代码运行次数:0
运行
复制
 Available Cancer codes:
 ACC BLCA BRCA CESC CHOL COAD DLBC ESCA GBM HNSC KICH
 KIRC KIRP LAML LGG LIHC LUAD LUSC MESO OV PAAD PCPG
 PRAD READ SARC SKCM STAD TGCT THCA THYM UCEC UCS UVM
 
Available Data Types:
 CNACGH CNACGH_CGH_hg_244a
 CNACGH_CGH_hg_415k_g4124a CNASeq CNASNP
 CNVSNP GISTIC_AllByGene GISTIC_Peaks
 GISTIC_ThresholdedByGene Methylation
 Methylation_methyl27 Methylation_methyl450
 miRNAArray miRNASeqGene mRNAArray
 mRNAArray_huex mRNAArray_TX_g4502a
 mRNAArray_TX_g4502a_1
 mRNAArray_TX_ht_hg_u133a Mutation
 RNASeq2GeneNorm RNASeqGene RPPAArray

每个癌症基本上都对应一个CNS文章,集中在2012年前后发表的,然后就爆发了2016年前后的TCGA数据库挖掘的大潮,但是TCGA官方在2018和2020自己团队就出了两次CNS子刊级别的TCGA数据库挖掘系列文章,基本上就断绝了TCGA数据库挖掘出好文章的可能性。

基于测序的多组学技术在癌症的首发CNS基本上没有咱中国科研团队的份,但因为2012那个时候国内搞一个普通转录组还得一两万,而且基本上没有正儿八经的多组学数据分析工程师。但是到2019,各种生信自媒体(生信技能树,生信菜鸟团)都大量解析了TCGA数据库挖掘文章的各种分析条目:

  • 视频地址:https://www.bilibili.com/video/av49363776
  • 代码地址:https://github.com/jmzeng1314/tcga_example

甚至集中在2012年前后发表的每个癌症对应的一个CNS文章,让多组学技术不再神秘:

测序成本的下降,绝大部分课题组都可以hold住多组学测序了,而且经过了五年培养,国内分析多组学数据的工程师也非常多了。但是科研前沿确实错过了,不可能说2012年前后发表的每个癌症对应的一个CNS文章,但是这个时候蛋白质组开始火爆,这个时候咱中国科研生力军都抢到了入场券。

比如2019的CELL 文章:《 Proteogenomic Analysis of Human Colon Cancer Reveals New Therapeutic Opportunities 》,在线链接是https://doi.org/10.1016/j.cell.2019.03.030,研究者首先收集了来自110个结直肠癌病人的肿瘤样本、临近正常组织(NATs)和血液样本(样本策略)并展开了label-free蛋白质组学、全外显子测序、copy-number array、RNA-seq、miRNA-seq的研究。为了进一步比较肿瘤和正常样本的蛋白水平的改变,研究者通过TMT标记的蛋白质组学和磷酸化修饰组学分析了肿瘤和NATs并整合基因组学数据揭示肿瘤治疗新靶点。

以及2020的中科院分子卓越中心与长海医院合作解析了中国人群晚期结肠癌患者基因及蛋白组图谱,相关的研究成果发表于《Cancer Cell》(IF:26.6)杂志,论文题目:“ Integrated Omics of Metastatic Colorectal Cancer”。该研究主要整合了来自146例中国结直肠癌(CRC)患者的480个临床组织的基因组学、蛋白质组学和磷酸化蛋白质组学,其中70例为转移性结直肠癌(mCRC)。蛋白质组学分析区分了三种具有不同临床预后和分子特征的CRC亚型。通过原发肿瘤样本蛋白质组学和磷酸化蛋白质组学能成功地鉴别转移患者。研究发现,转移性肿瘤组织在基因水平上与原发肿瘤高度相似,但在蛋白质组学水平上不相似,激酶网络分析显示原发结直肠癌及其肝转移之间存在显著的异质性。利用31个原发和转移性肿瘤的PDX药物试验显示,无论肿瘤是否携带药物靶向基因突变,都可以通过激酶-底物网络分析预测。

以前的2012年前后发表的每个癌症对应的一个CNS文章并不会过多触及到蛋白质层面,讨论的是基因的拷贝数和mRNA转录水平的相关性,但是2019前后的蛋白质组大文章,就需要讨论基因的拷贝数,mRNA转录,和蛋白翻译水平相关性,所以有一个2022的综述:

代码语言:javascript
代码运行次数:0
运行
复制
原名:Clinical proteomics towards multiomics in cancer
译名:面向癌症多组学的临床蛋白质组学
期刊:Mass Spectrometry Reviews
IF:9.011
发表时间:2022.12
通讯作者:Chad J. Creighton
通讯作者单位:贝勒医学院

值得注意的是虽然整体来说mRNA转录和蛋白翻译水平还挺好的,如下所示:

整体来说mRNA转录和蛋白翻译水平还挺好的

但是具体的不同的生物学功能通路来说,比如参与细胞粘附、脂肪酸代谢和适应性免疫反应的基因往往在细胞系中的蛋白质和mRNA之间高度相关,而参与核糖体或氧化磷酸化的基因往往不太相关,如下所示:

核糖体或氧化磷酸化的基因往往不太相关

恰好最近收到了《钱塘生物》的吴向伟在其科研服务测序服务生涯的关于转录组和蛋白质组数据的不一致性的思考,分享给大家:


转录组和蛋白质组数据的不一致性是一个普遍性的问题。按照逻辑来讲,mRNA的变化自然会传导到蛋白质上,进而真实的影响代谢以至于生命活动,这个也是我们由表型变化联想到做转录组及蛋白质组的基础。虽然我们知道转录组及蛋白质组数据的不一致性是客观真实的现象,但具体怎么合理的解释该现象、这些不一致的地方能否给我们带来更有价值的探索机制线索,还是对这些不一致的地方视而不见、仅取两者一致的数据向下挖掘,一直没有见到很好的说法。最近做了不少组学关联的项目,做了一些思考,整理出来供大家参考。

如果始终以mRNA为中心的话,感觉很容易陷入上述逻辑矛盾中。那么我在想有没有可能变量(外界刺激、基因敲除、沉默等)引起的变化是以蛋白质层面的调节为中心的。

mRNA变化是否必需?

首先我们需要问,是否变量必然会传导至mRNA,进而通过中心法则往下传?从经济角度来看,如果信号优先传到了蛋白质层面,以蛋白质的为中心这种方式进行调控甚至可能是更划算的,毕竟酶活反应快速且高效。比如把信号快速而有选择性的传到蛋白修饰进而调控代谢。

如何解释转录组和蛋白质组结果相反的现象?

如果我们以蛋白质的变化为中心来看的话,很容易想到反馈调节。蛋白质的变化引起了代谢物的变化,其作为信号因子反过来直接调控了mRNA。而反馈调节就有了正反馈和负反馈。其中负反馈就刚好对应了结果相反的数据,负反馈的存在是为了维持平衡,打破平衡的时候负反馈就会发挥作用。比如说某个蛋白被降解掉了,受其调控的代谢物必然少,那么负反馈就会让其mRNA升高,如果这个mRNA升高对于整体调控是没有意义的,那么该mRNA就会在RNA修饰等阶段被做掉;比如说某个蛋白通过磷酸化被激活了,那么它的功能就被强化了,它如果有负反馈的话,其mRNA表达量反而会降低,但我们却不可能在蛋白质水平检测到变化,因为急剧的变化发生在了该蛋白磷酸化修饰层面。

同时对于转录组和蛋白质一个有变化一个没有变化,我们可以解释为调控发生在蛋白质修饰阶段或者mRNA促翻译阶段。

综上,我个人觉得对于转录组及蛋白质组联合分析,我们进行富集分析****的时候不应该仅仅取两者的交集,同时应该也取两者的并集看看结果。只要我们坚能够确信实验过程没有问题,那些看似矛盾的结果里面可能隐藏着另外一个激动人心的故事。

按照上述的推测,调控的主要途径有没有可能是:

变量—>蛋白质修饰—>代谢变化—>反馈至翻译过程(mRNA修饰、转录复合物等调控)、反馈至转录过程

如果调控的重点是修饰,我们做普通转录组和蛋白质组是不是没有意义了呢?这个肯定是有意义的,这些数据给我们提供了思考的基础,其中矛盾的数据恰似周伯通左右手互搏,是未知的隐秘。同时当我们找到了两个技术矛盾的合理解释的时候,会发现孤立的使用一种技术是不完善的,往下推测缺少足够多的支点,所以多组学联合是必然的一个趋势。如果一切都是修饰主导的,那么等我们穷极了所有的RNA及蛋白的修饰后,也许RNA和蛋白质的量会成为最终的marker。

只要我们认同生命科学不是玄学,客观规律一定发生在我们没有看见的角落。

要对客观数据有信心。对于经得起检验的组学结果,我们更应该追问的是它提示了什么,而不是为什么不符合我的预期。面对庞杂纷乱的生物调控,我们对预期越坚定,惰性也就越强,很有可能导致我们对谜底失之交臂。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-02-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • mRNA变化是否必需?
  • 如何解释转录组和蛋白质组结果相反的现象?
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档