首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >空间转录组数据中细胞类型去卷积的综合回顾

空间转录组数据中细胞类型去卷积的综合回顾

原创
作者头像
追风少年i
发布2026-01-05 10:56:55
发布2026-01-05 10:56:55
1280
举报

作者,Evil Genius

二十年快的很,弹指一挥间

单细胞空间也一样,17年到现在,弹指一挥间。

现有空间去卷积方法的总结,最好的仍然是cell2location.

Spatial niche

影响空间转录组反卷积结果的四个关键因素

1 参考数据的可靠性

参考数据的质量是基于参考方法性能的基石,其选择已被证实直接影响结果准确性。

核心要求:理想的参考数据应具备:

精确的细胞类型注释

足够的每个细胞类型的基因数量

全面的组织细胞类型覆盖

能够识别细胞类型间表达差异显著的特定基因

主要挑战:

某些空间特异性细胞类型(如小鼠大脑中特定神经元亚型)可能仅凭scRNA-seq数据难以识别或区分。

部分细胞类型(如软骨干细胞、单核细胞与树突状细胞)缺乏公认的标志基因。

测序深度直接影响基因检出数和细胞类型覆盖度,进而限制参考数据的可靠性。

细胞类型特异性基因的选择

这类基因是区分不同细胞类型的关键生物学标记,其选择需兼顾:

生物学特异性:基因应在特定细胞类型中高表达,在其他类型中低表达。

数据与背景依赖性:基因表达具有动态性和环境依赖性。例如,健康与疾病状态下同一细胞类型的表达模式可能存在显著差异,导致标志基因特异性丧失。

实践方法:常用工具(如Seurat的FindAllMarkers、Giotto的findMarkers_one_vs_all)通过差异表达分析筛选标志基因。也有专门工具(如scMAGS)为ST研究从scRNA-seq数据中筛选基因。

3 数据预处理的影响

预处理步骤(如标准化、转换、缩放)对反卷积计算具有关键影响。

方法差异:

部分方法(如DestVI、SPOTlight)将标准化过程直接整合到模型中。

部分方法(如Cell2location、Stereoscope)直接对原始计数数据进行建模,便于跨方法比较。

研究发现:某些情况下(如SCANPY的几种标准化方法对比),使用原始数据作为输入可能优于使用标准化后的数据,因为额外的标准化步骤可能导致性能下降。而另一些方法(如Tangram)则表明对数标准化能带来更好表现。

4 参考数据与ST数据间的批次效应

批次效应源于样本收集、处理、测序平台或分析流程的系统性差异,是整合分析的主要挑战之一。

影响:导致scRNA-seq与ST数据间特定基因表达不一致,降低从混合点中解析细胞类型的可靠性。

缓解策略:

数据调整:对scRNA-seq数据进行校正,以减少与ST数据间的分布差异。

模型整合:先进方法在建模中直接纳入批次效应校正:

RCTD:纳入点特异性效应、基因特异性平台随机效应和过度离散参数。

Cell2location:使用基因特异性缩放参数调整技术间的灵敏度差异。

现状与挑战:尽管现有方法已能部分改善准确性,但批次效应的内在复杂性和多面性使其仍是一个持续存在的难题,需要相关技术与方法的不断探索和优化。

生活很好,有你更好

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 作者,Evil Genius
  • 二十年快的很,弹指一挥间
  • 单细胞空间也一样,17年到现在,弹指一挥间。
  • 现有空间去卷积方法的总结,最好的仍然是cell2location.
  • Spatial niche
  • 影响空间转录组反卷积结果的四个关键因素
  • 1 参考数据的可靠性
  • 参考数据的质量是基于参考方法性能的基石,其选择已被证实直接影响结果准确性。
  • 核心要求:理想的参考数据应具备:
  • 精确的细胞类型注释
  • 足够的每个细胞类型的基因数量
  • 全面的组织细胞类型覆盖
  • 能够识别细胞类型间表达差异显著的特定基因
  • 主要挑战:
  • 某些空间特异性细胞类型(如小鼠大脑中特定神经元亚型)可能仅凭scRNA-seq数据难以识别或区分。
  • 部分细胞类型(如软骨干细胞、单核细胞与树突状细胞)缺乏公认的标志基因。
  • 测序深度直接影响基因检出数和细胞类型覆盖度,进而限制参考数据的可靠性。
  • 细胞类型特异性基因的选择
  • 这类基因是区分不同细胞类型的关键生物学标记,其选择需兼顾:
  • 生物学特异性:基因应在特定细胞类型中高表达,在其他类型中低表达。
  • 数据与背景依赖性:基因表达具有动态性和环境依赖性。例如,健康与疾病状态下同一细胞类型的表达模式可能存在显著差异,导致标志基因特异性丧失。
  • 实践方法:常用工具(如Seurat的FindAllMarkers、Giotto的findMarkers_one_vs_all)通过差异表达分析筛选标志基因。也有专门工具(如scMAGS)为ST研究从scRNA-seq数据中筛选基因。
  • 3 数据预处理的影响
  • 预处理步骤(如标准化、转换、缩放)对反卷积计算具有关键影响。
  • 方法差异:
  • 部分方法(如DestVI、SPOTlight)将标准化过程直接整合到模型中。
  • 部分方法(如Cell2location、Stereoscope)直接对原始计数数据进行建模,便于跨方法比较。
  • 研究发现:某些情况下(如SCANPY的几种标准化方法对比),使用原始数据作为输入可能优于使用标准化后的数据,因为额外的标准化步骤可能导致性能下降。而另一些方法(如Tangram)则表明对数标准化能带来更好表现。
  • 4 参考数据与ST数据间的批次效应
  • 批次效应源于样本收集、处理、测序平台或分析流程的系统性差异,是整合分析的主要挑战之一。
  • 影响:导致scRNA-seq与ST数据间特定基因表达不一致,降低从混合点中解析细胞类型的可靠性。
  • 缓解策略:
  • 数据调整:对scRNA-seq数据进行校正,以减少与ST数据间的分布差异。
  • 模型整合:先进方法在建模中直接纳入批次效应校正:
  • RCTD:纳入点特异性效应、基因特异性平台随机效应和过度离散参数。
  • Cell2location:使用基因特异性缩放参数调整技术间的灵敏度差异。
  • 现状与挑战:尽管现有方法已能部分改善准确性,但批次效应的内在复杂性和多面性使其仍是一个持续存在的难题,需要相关技术与方法的不断探索和优化。
  • 生活很好,有你更好
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档