有了海量的测序数据后,大家很容易通过生物信息学数据分析拿到一些目标基因或者通路。这个时候简单的发文章思路就是针对目标基因做一下敲减过表达或者其它实验验证,而实验结果通常是不能保证阳性的,比如在癌症和正常没有差异,不影响癌症的发生发展增殖转移等等。
面对阴性结果,有一些“机智地”小伙伴就会“悄咪咪”的通过“秦桧法”和“赵高法”选择性的人造阳性结果,反正就是发个文章混个日子。这样非常的不好,因为实验细节是没办法验证,并不是测序数据这样可以公开出来所有人下载后就可以分析和验证。实验基本上就完全靠科研团队的人品了。。。
还不如大力的支持发表阴性结果,比如我最近刷到了一个2024年11月的文章:《Colorectal carcinoma progression is not influenced by the pseudokinase PEAK1》,从标题看就是一个阴性的结果。
无非就是海量的geo数据集以及tcga数据库的crc数据集里面的PEAK1基因是否在癌症和癌旁有表达量差异,或者在疾病进展过程有表达量的趋势变化。或者是多个有临床信息的geo队列看看PEAK1基因是否有生存意义。
首先可以看到,多个数据集里面,这个PEAK1的表达量其实是在肿瘤里面,相当于正常组织或者癌旁来说,略微下降的。
数据集: logFC, 矫正p值
GSE110224/DEG.csv:"PEAK1",-0.173412421385812,0.281339616556948
GSE22598/DEG.csv:"PEAK1",-0.804364329715169,1.36846614620063e-05
GSE37364/DEG.csv:"PEAK1",-0.570298968264264,1.25038945975297e-08
GSE4183/DEG.csv:"PEAK1",-0.276098286825411,0.381816376005174
然后看看这个PEAK1基因的生存意义,基本上可以看到它的高表达量是坏的预后:
gene PEAK1
2024-nature 1.12
GSE14333 1.585
GSE161158 1.248
GSE33113 3.642
GSE39582 1.173
这个时候,就会让普通人比较费解,它既然是在癌症里面表达量下降,理论上它的高表达量就不应该是坏的预后。
而且,从一个2024的nature文章的单细胞转录组数据集: 260,922 single cells from normal, inflamed and neoplastic intestinal tissues, 是有这个PEAK1基因的特异性的上皮细胞亚群,蛮有意思的。而且它确实是随着组织倾向于癌症,减少了。这就是为什么在癌症和癌旁的bulk转录表达量里面看到它是下降的原因吧。
有这个PEAK1基因的特异性的上皮细胞亚群
感兴趣的小伙伴可以去读一下这个nature文章:《Polyclonal-to-monoclonal transition in colorectal precancerous evolution》
不过呢,前面提到的PEAK1在结直肠癌阴性结果的文章发表在名声比较差的杂志,所以就没有我演示的这么多生物信息学数据挖掘引子。
这篇文章的核心内容是研究伪激酶PEAK1在结直肠癌(Colorectal Carcinoma, CRC)进展中的作用。尽管PEAK1在多种癌症中被认为与肿瘤进展有关,但在CRC中的作用尚存在争议。这篇文章通过体外和体内的实验模型,探讨了PEAK1在CRC进展中的作用,并得出结论认为PEAK1对CRC进展的影响有限。