大家在网络上看得到的生物信息学教程,一半都是转录组方面的数据处理心得体会,包括表达量芯片和转录组测序。而且其中一波都是集中在基因的表达量差异分析而已,实际上生命科学领域可以探索的东西非常多!
从分子生物学的角度来看,基因的表达量高低变化只是中心法则中的一个方面。中心法则描述了遗传信息的流动方向,主要包括以下几个过程:
除了上述基本过程,一些其他的分子机制也广为人知,例如:
而且每种机制都有其对应的技术手段进行研究,例如:
这些技术和方法为我们提供了深入理解基因表达调控和中心法则在分子层面上如何运作的途径。
其中RNA测序(RNA-seq)是大家耳熟能详的技术手段,如果是二十年前做一个转录组样品可能会过万的费用,十年前就千把块钱了,五年前就五六百块钱,现在就三百多块钱了。详见:转录组价格腰斩哈!(优化升级后单个样本仅399元)
但是因为网络上最方便的教程就是差异分析:常规的表达量矩阵只需要实验设计合理,比如两分组的,就可以不管三七二十一,差异分析走起,上下调基因判断ok了,就火山图热图画出来了。这些常规的分析相信大家都不陌生了,基本上看我10年前的表达芯片的公共数据库挖掘系列推文即可;
导致转录组测序发展这么多年了仍然是基因表达量差异分析而已,实际上如果我们问一下人工智能大模型就可以看到比较详细的分析要点:
可以区分来自同一基因座上的两个等位基因的表达情况,即等位基因特异表达(Allele-Specific Expression, ASE)。这种技术特别适用于研究遗传多样性和基因表达调控,尤其是在杂合个体中。ASE分析有助于揭示顺式作用因子(cis-regulatory elements)和反式作用因子(trans-acting factors)对基因表达的影响,以及它们在不同组织和生物学过程中的作用。
Antisense转录本,即与正义链转录本方向相反的RNA分子,也可以通过链特异性RNA-seq技术进行检测。这些转录本可能参与基因表达的调控,影响mRNA的稳定性和翻译效率,甚至参与非编码RNA的功能。
进行ASE和Antisense转录本分析时,需要特别注意的是,链特异性RNA-seq建库方法可能影响测序数据的解读。例如,使用dUTP代替dTTP的方法可以产生链特异性的cDNA,从而在测序过程中保留RNA的原始方向信息。在分析时,需要根据所使用的链特异性测序方法设置正确的参数,以确保结果的准确性。
最近在朋友圈刷到了2024年8月2日的Science期刊上的论文标题为“Modeling late-onset Alzheimer’s disease neuropathology via direct neuronal reprogramming”的皮肤细胞变神经元的研究,没有意思的,居然是直接重编程技术再现阿尔茨海默病特征!是来自美国圣路易斯华盛顿大学医学院的资深发育生物学教授Andrew Yoo团队的研究成果。
文章里面就是3个转录组数据:(GSE267613, GSE252932, and GSE253174),很容易在文章里面看到3个平平无奇的差异分析后的火山图以及富集分析后的生物学功能数据库注释信息条形图:
差异分析后的火山图以及富集分析后的生物学功能数据库注释信息条形图
当然了,既然是已经在Science期刊上的论文,我们肯定是没办法去苛责他们对转录组数据的浪费。不过我还是比较好奇,其它层面的数据分析真的是没有什么必要性吗?