首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >空间转录组细胞解卷积的实用指南:18种方法测评

空间转录组细胞解卷积的实用指南:18种方法测评

作者头像
生信技能树
发布2025-07-14 10:00:11
发布2025-07-14 10:00:11
5570
举报
文章被收录于专栏:生信技能树生信技能树

前面我们看了一篇综述比较空转的反卷积方法好坏:空转反卷积方法哪家好:来看看主流的10种算法大比拼,这篇文章里面提到 在不同组织和技术平台上,RCTD和stereoscope方法在推断细胞类型组成方面更为稳健和准确。

今天来看看这篇2023年3月份发表在Nature Communications上面:《A comprehensive benchmarking with practical guidelines for cellular deconvolution of spatial transcriptomics》的文献里面结论如何。

这篇文献使用了50个真实世界和模拟数据集对18种现有的方法进行基准测试,通过评估方法的准确性、鲁棒性和易用性来解决细胞解卷积任务,并使用不同的指标、分辨率、空间转录组技术、spot 数量和基因数量对这些方法进行了全面比较。在性能方面,CARD、Cell2location和Tangram是进行细胞解卷积任务的最佳方法。为了完善我们的比较结果,我们提供了决策树风格的指南和建议,用于选择方法及其附加功能,这将帮助用户轻松选择最适合他们需求的方法。

基准测试流程

为了全面评估细胞解卷积方法,我们从已发表和预印本论文中确定了18种现有方法,如下所示:CARD、Cell2location、RCTD、DestVI、stereoscope、SpatialDecon、STRIDE、NMFreg、SpatialDWLS、SPOTlight、DSTG、SD、Tangram、Berglund、SpiceMix、STdeconvolve、SpaOTsc和novoSpaRc。基准测试结果根据方法的准确性、鲁棒性和易用性进行衡量。

方法分类

  • 是否依赖scRNA-seq参考
    • 不依赖scRNA-seq参考:Berglund、SpiceMix 和S Tdeconvolve,仅利用空间位置信息和基因表达谱识别细胞类型特异性空间模式。
    • 依赖scRNA-seq参考:其余15种方法需要与空间转录组数据来自同一组织的scRNA-seq数据,利用细胞类型注释和基因表达谱优化细胞类型比例。
  • 计算技术分类
    • 基于概率的方法:Berglund、Cell2location、DestVI、RCTD、SpatialDecon、stereoscope、STRIDE、STdeconvolve。
    • 基于非负矩阵分解(NMF)的方法:CARD、NMFreg、SpatialDWLS、SPOTlight、SpiceMix。
    • 基于图的方法:DSTG、SD2。
    • 基于深度学习的方法:Tangram。
    • 基于最优传输(OT)的方法:SpaOTsc、novoSpaRc。
图片
图片

测试数据

收集了七个基于图像和基于测序的空间转录组数据集:seqFISH、MERFISH、空间转录组学(ST)、10X Visium(Visium)、Slide-seqV2和stereo-seq。其对应的单细胞转录组测序(scRNA-seq)数据集作为补充资源被收集(补充表1)。所有的整理好的数据和代码都可以在这里下载:https://zenodo.org/records/7674290

  • seqFISH+: 单细胞和空转数据可以在这里下载 https://github.com/CaiGroup/seqFISH-PLUS.
  • MERFISH: 单细胞数据 https://github.com/rdong08/spatialDWLS_dataset/tree/main/datasets, 空转数据 https://datadryad.org/stash/dataset/doi:10.5061/dryad.8t8s248/.
  • ST: 单细胞和空转数据GSE111672.
  • Visium: 单细胞和空转数据下载 https://github.com/BayraktarLab/cell2location.
  • Slide-seqV2: 单细胞和空转数据 https://github.com/dmcable/spacexr.
  • Stereo-seq (olfactory bulb): 单细胞数据 GSE71585, and 空转数据 https://db.cngb.org/stomics/mosta/.
  • Stereo-seq (zebrafish embryo): 单细胞和空转数据 https://db.cngb.org/stomics/datasets/STDS0000057.

所有方法性能的评估总结

用可视化的方式展示了它们在准确性(红色)、鲁棒性(蓝色)和易用性(绿色)方面的表现,并且列出了每种方法对空间位置的要求、编程语言以及整体性能(灰色)。对于所有彩色点,颜色越深表示性能越好。在鲁棒性的归一化和超参数部分显示的黑点意味着这些方法仅需要原始计数作为输入的空间转录组数据,或者没有超参数可以调节。

每种方法的性能随着所使用的数据资源而变化,但有些方法在模拟数据集和真实世界数据集上都表现出稳定的高准确性,例如Cell2location和DestVI(图2)。

图片
图片

模拟数据的评估结果

使用模拟数据时:

  • 大多数方法在MERFISH上表现良好,但只有CARD、DestVI和SpatialDWLS在seqFISH⁺上表现优异,表明它们在点位数量较少的情况下也能很好地工作。
  • 当点位数量较多(即MERFISH和Slide-seqV2)时,Cell2location、SpatialDecon和Tangram最能对组织的大范围视图进行解卷积。
  • 此外,SpatialDWLS在模拟数据集上表现良好,但在所有真实世界数据集上表现不佳。
  • seqFISH⁺中所有六种细胞类型和MERFISH中12个样本的全部细胞类型比例及其真实值在所有方法中进行了可视化(图3A、B)
图片
图片
  • 鲁棒性评估:通过多种实验条件评估了18种细胞解卷积方法的鲁棒性。表现最佳的方法:CARD、Cell2location、Tangram和SD2在不同条件下表现最为稳健。
  • 最高效的方法:NMFreg、STRIDE和Tangram在运行时间上表现最佳。
  • 用户友好性:大多数方法满足了用户的基本需求,其中CARD、Cell2location、RCTD和DestVI表现尤为突出,提供了高质量的教程和易于实现的代码。

用户指南

最后作者提供了一个指南用于指导用户可以根据自己的项目情况来进行方法选择:

图片
图片
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-07-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 基准测试流程
  • 测试数据
  • 所有方法性能的评估总结
  • 模拟数据的评估结果
  • 用户指南
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档