1、Cell专题发表全球首批生命时空图谱,国家基因库发布时空组专辑数据库开启文献“可视化解读”新模式!(qq.com)
为推动时空组学在生命科学各个领域的广泛应用,华大研究院等机构发起了时空组学联盟,这是一个国际化科学联盟,由来自哈佛大学、剑桥大学、牛津大学等16个国家的80多位科学家组成。
作为STOMICS DataBase的子库——时空组专辑数据库与Cell专题同期发布。上述4篇Cell系列模式生物时空组学研究成果相关数据库/数据集均已收录在时空组专辑数据库中。科研人员可以通过该专辑数据库快速获取文献概要、研究数据、分析工具、数据可视化分析结果等关键信息,全面提升文献要点解读及数据/分析工具搜索效率,促进时空组学领域科研成果转化及技术发展。
STOMICS DataBase (cngb.org)[1]
这种整合了多种文献和数据的资源库,才是做数据科学应该有的姿态。
stomicsDB 也提供了简单的可视化分析功能:
不过我的另一个思考是,能不能提供一套模范化的脚本去供他人可重复、学习呢?
2、生命大数据可信计算平台 (cngb.org)[2]
大家用过华大的一系列在线分析平台吗?
CODEPLOT 是一个致力于为用户提供可信赖的、灵活的计算平台,您可在没有编程背景的情况下进行自动化生物信息学分析,采用区块链、多方安全计算等前沿技术,确保用户的数据安全;CODEPLOT 不断对数据进行整理和整合,为全球的研究者提供当前最全面的数据和信息资源,科研人员能更够便捷地进行计算分析和挖掘。
可以直接选定数据集:
操纵数据集中收录的一些步骤:
并且任务结束后还有邮件通知你:
直接可以下载结果了:
可以查看使用的数据集:
而且可以查看对应的wdl 语言:
如果你是使用wdl 做pipeline 开发,可以参考一下其各个软件的流程。
可如果只是单纯的这样零碎的添加数据集项目中涉及的一到两个分析工具,可谓之“工作流程”吗?
如果是可视化的拖拽各个流程模块,设置其参数和配置文件,会不会更好呢?
会不会更加便捷学习和可重复执行呢?
我的小snakemake 希望未来也朝着这样发展。
3、Galaxy (usegalaxy.org)[3]
说时迟那时快,我发现了galaxy:
galaxy 也提供了全套的教程:Galaxy Training! (usegalaxy.org)[4]
最关键的,他还能部署到本地,并且个性化的增删改流程:可视化生信分析利器-Galaxy(第一讲) - 简书 (jianshu.com)[5]
为什么我们现在的科学研究没有使用像这样的工具上来呢?
从使用来看,galaxy 可视化界面非常易于上手。只是不清楚其流程语法上手是否如snakemake 般容易。
感觉手里的snakemake 忽然不香了。
4、国家癌症中心发布:2022年全国癌症报告 (qq.com)
新发病例:406.4万 世标发病率:186.46/10万 男性高于女性(207.03/10万 vs 168.14/10万)
总死亡人数:241.4万 世标死亡率:105.19/10万 男性高于女性(138.14/10万 vs 73.95/10万)
中国人的抗癌路,任重道远。
5、KubeGene[6]
A turn-key genome sequencing workflow management framework
KubeGene is dedicated to making genome sequencing process simple, portable and scalable. It provides a complete solution for genome sequencing on the kubernetes and supports mainstream biological genome sequencing scenarios such as DNA, RNA, and liquid biopsy. KubeGene is based on lightweight container technology and official standard algorithms. You can make a flexible and customizable genome sequencing process by using KubeGene.
华为云还推出了KubeGene开源项目,把基因容器最核心的部分开源给广大基因科学领域的企业和用户。
6、这个legend 很有灵性 文章:Subclone-specific microenvironmental impact and drug response in refractory multiple myeloma revealed by single‐cell transcriptomics
7、基因结构 - 知乎 (zhihu.com)[7]
解决了我一直以来对于编码区域、可转录区域和蛋白编码区域的疑惑。
8、肿瘤研究者的圣经:Hallmarks of Cancer:New Dimensions (qq.com)
在既有的10大标志性特征的基础上,本文作者此次再度增加了4个特征,分别是:解锁表型可塑性(Unlocking phenotypic plasticity)、非突变表观遗传重编程(Non-mutational epigenetic reprogramming)、多态性的微生物组(Polymorphic microbiomes)和衰老细胞(Senescent cells)。
上面的Hallmarks 提到衰老细胞可通过衰老相关分泌表型等方式促进肿瘤的发生和发展。
Cancer Cell上,阿拉巴马大学伯明翰分校的一些研究者就发现,凋亡的胶质母细胞瘤会释放胞外囊泡,含有恶性促肿瘤的剪切碎片,它再转入存活的胶质母细胞瘤细胞,促进他们发生恶性表型改变,并对治疗产生抗性。
细胞死亡可能促进基因组的不稳定性和创建新的生态位(Onco-Regenerative Niche ,ORN),导致更具有侵袭性的肿瘤细胞增殖,形成新克隆重新聚集。分泌的凋亡囊泡可以促进血管新生,激活肿瘤相关巨噬细胞,诱导肿瘤微环境重构,转移。
诱导凋亡是我们抗肿瘤治疗一直以来的目标和策略。但是肿瘤细胞也通过主动诱导凋亡形成促进其生长转移的新生态位。所以,单纯的凋亡可能无法给我抗肿瘤治疗成或败的信息。那么,诱导凋亡的细胞毒性药物(小分子或者大分子)还会是研究和开发的重点吗?
10、Knowledge based | 如何获取某类肿瘤中所有已被报道的相关突变基因?
somatic >> cosmic germline >> clinvar
比如 Colorectal Cancer:Colorectal Cancer disease: Malacards - Research Articles, Drugs, Genes, Clinical Trials[9]
[1]
STOMICS DataBase (cngb.org): https://db.cngb.org/stomics/
[2]
生命大数据可信计算平台 (cngb.org): https://db.cngb.org/codeplot
[3]
Galaxy (usegalaxy.org): https://usegalaxy.org/workflow/editor?id=55da48707ff0c327
[4]
Galaxy Training! (usegalaxy.org): https://usegalaxy.org/training-material/
[5]
可视化生信分析利器-Galaxy(第一讲) - 简书 (jianshu.com): https://www.jianshu.com/p/a1f297eb4859
[6]
KubeGene: https://kubegene.io/
[7]
基因结构 - 知乎 (zhihu.com): https://zhuanlan.zhihu.com/p/49601643
[8]
MalaCards - human disease database: https://www.malacards.org/pages/info/
[9]
Colorectal Cancer disease: Malacards - Research Articles, Drugs, Genes, Clinical Trials: https://www.malacards.org/card/colorectal_cancer?search=breast%20cancer#related_genes