这个系列大概会涉及到的一些文章如下
本文主要是起 introduction 的作用,简述一下核心的思想。
个人理解 single cell 技术最重要的优势:单细胞水平的分辨率 + 高通量带来的大样本
Griffiths, Jonathan A., Antonio Scialdone, and John C. Marioni. Molecular systems biology, 2018
Svensson, Valentine, Roser Vento-Tormo, and Sarah A. Teichmann. Nature protocols, 2018
但是之前大多数 single cell 技术都是静态的刻画 cell state(即都是snapshot),没有能够引入细胞随时间的变化,living cell imaging tracking 的技术虽然能提供时间信息,但是能够覆盖到gene 数量是非常少的(通常也就不到10)。
而发育分化过程中 cell state 是动态变化的,因此怎么能够理解 cell state transition,怎么将这些 snapshot 拼成 video 就是一个很有意思且很重要的问题。
18年 “RNA velocity of single cells” 首先引入 RNA velocity 这个概念,充分利用现有的数据来得到全新的概念。可以说是非常精彩了(Ps. 申请 EMBL-EBI 的时候要列最喜欢的一篇文章,我就列了这个这篇)。
核心的思想就是,利用 splicing 这个生物过程来引入时间这个要素,从而推断出 cell state 的 velocity(速率)。
具体是什么意思呢,首先从一个例子说起,当我们看到下图这些跑步中的中间状态的时候,我们脑海中是可以串联起这四个动作的。
https://iwanttobeananimator.wordpress.com/2017/02/15/ref_run-cycle_02/
我们可以从其中一个 snapshot 知道图中小人的运动状态,并且预测运动的方向。本质原因是因为我们对跑步这个过程有一个动力学的认识。
那么我们回到细胞内的转录,我们只需要通过中心法则中依赖于时间的生物过程,并对这个过程进行动力学刻画即可以得到这些 snapshot 的未来方向,那么应该使用什么生物过程呢?首先需要满足两个条件,1. 依赖于时间,2. 现有的数据中应该可以直接得到
答案就是 splicing!首先 splicing 肯定依赖于时间,其次现有的测序 reads 天然的可以 mapping 到 intro 和 exon, 从而得到 unspliced 和 spliced 的RNA。
Gene 在转录成 mRNA 的过程中会经过 splicing,而 splicing 的动力学我们是通过 ODE 来 model 的,因此我们便可以通过 unspliced mRNA (u)和 spliced RNA(s) ,以及动力模型( ODE model) 来计算 cell state 的 velocity 。我们可以得到
上述便是 RNA velocity 的 key idea,至于随机模型,那就是考虑到真实值是离散的,所以利用化学主方程(Master equation)来研究,并且分析。
私以为上述几篇文章中可以称的上 beyond 的也就是 "Mapping vector field of single cells" [dynamo(https://dynamo-release.readthedocs.io/en/latest/)],结合 metabolic labeling (能够标记新生成的 mRNA),引入真实的时间,从而从两个时间尺度来刻画 velocity
Qiu X, Zhang Y, Yang D, et al. Mapping vector field of single cells[J]. Biorxiv, 2021
包括三种model
Qiu X, Zhang Y, Yang D, et al. Mapping vector field of single cells[J]. Biorxiv, 2021