从今天开始,用 21 天精通单细胞数据分析。我们将理论联系实际,边学边练,本文先从理论开始。
https://usegalaxy.cn/training-material/topics/single-cell/tutorials/scrna-intro/slides_ZH-CN.html#1
在线 PPT 有更好的阅读体验,请通过上述链接查看。
提示: 在线阅读,按 P
显示演讲者提示;方向箭头切换幻灯片。
例如,细胞是如何被捕获和测序的?
在批量 RNA 测序分析中,该过程包括取样、去除不需要的分子以及对其余内容进行测序。
细胞分离可以通过不同的方式进行。
一种方法是手动移液,其中湿实验室的科学家使用一根长细管吸起单个细胞。
他们可以这样做数百次来分离数百个细胞,但这容易出错,并且经常一起分离出多个细胞。
另一种方法是流式细胞术,这减少了这一阶段的人为误差成分。
侧向散射是垂直于主激光的,它测量细胞的粒度,非常适合区分内部结构不太明确的细胞,如示例图像 Y 轴上的粒细胞。
一旦 RNA 分子被细胞条形码标记,它们就可以被扩增,无论是单独还是一起混合,扩增后的产物与其原始对应物共享相同的细胞条形码。
然而,如果我们按它们的 UMIs 对读取进行分组,然后只计算每个转录本的唯一 UMIs 的数量,对共享相同转录本和 UMI 的读取进行去重,我们得到 2 个红色读取和 2 个蓝色读取,这更好地代表了转录本的真实数量。
这是由于转录本的数量通常比可用的 UMI(唯一分子标识符)多,这两者都取决于细胞中的转录本数量和条形码的长度。
在扩增的背景下,唯一分子标识符(UMIs)不需要是唯一的,它们只需要足够随机,以便去重转录本,从而更准确地估计细胞内的转录本数量。
让我们简单回顾一下我们学到的内容:首先,每个细胞中的每个 RNA 分子都添加了细胞条形码。
我们还可以进一步推导出这些簇之间的关系,通过计算基于每个簇中的噪声量来构建谱系树,期望干细胞具有嘈杂的表达谱,从而形成更宽的簇,而成熟细胞具有非常清晰的表达谱,从而形成更紧密的簇。
软聚类是预期中的现象,因为尽管聚类是一种将数据离散分区的统计方法,但数据背后的细胞生物学是一个连续的过程,在这个过程中,细胞通过中间阶段从一个明确定义的状态过渡到另一个状态,这些中间阶段在两个簇中心之间得到表示。
如果新的配置反而增加了外部链接的数量,则该配置将被拒绝,并选择另一个单元格进行测试。通过多次执行此操作,可以构建出用户所需的特定程度的单元格社区结构。
云上转录组分析流程(点击图片跳转)
什么生信流程语言让你极度爽?(点击图片跳转)