前面我们看了一篇综述比较空转的反卷积方法好坏:空转反卷积方法哪家好:来看看主流的10种算法大比拼 ,这篇文章里面提到 在不同组织和技术平台上,RCTD和stereoscope方法在推断细胞类型组成方面更为稳健和准确。
今天来看看这篇2023年3月份发表在Nature Communications上面:《A comprehensive benchmarking with practical guidelines for cellular deconvolution of spatial transcriptomics》的文献里面结论如何。
这篇文献使用了50个真实世界和模拟数据集对18种现有的方法进行基准测试,通过评估方法的准确性、鲁棒性和易用性来解决细胞解卷积任务,并使用不同的指标、分辨率、空间转录组技术、spot 数量和基因数量对这些方法进行了全面比较。在性能方面,CARD、Cell2location和Tangram是进行细胞解卷积任务的最佳方法。 为了完善我们的比较结果,我们提供了决策树风格的指南和建议,用于选择方法及其附加功能,这将帮助用户轻松选择最适合他们需求的方法。
基准测试流程 为了全面评估细胞解卷积方法,我们从已发表和预印本论文中确定了18种现有方法,如下所示:CARD、Cell2location、RCTD、DestVI、stereoscope、SpatialDecon、STRIDE、NMFreg、SpatialDWLS、SPOTlight、DSTG、SD、Tangram、Berglund、SpiceMix、STdeconvolve、SpaOTsc和novoSpaRc。基准测试结果根据方法的准确性、鲁棒性和易用性进行衡量。
方法分类 :
是否依赖scRNA-seq参考 :不依赖scRNA-seq参考 :Berglund、SpiceMix 和S Tdeconvolve,仅利用空间位置信息和基因表达谱识别细胞类型特异性空间模式。依赖scRNA-seq参考 :其余15种方法需要与空间转录组数据来自 同一组织的scRNA-seq数据,利用细胞类型注释和基因表达谱优化细胞类型比例。计算技术分类 :基于概率的方法 :Berglund、Cell2location、DestVI、RCTD、SpatialDecon、stereoscope、STRIDE、STdeconvolve。基于非负矩阵分解(NMF)的方法 :CARD、NMFreg、SpatialDWLS、SPOTlight、SpiceMix。基于图的方法 :DSTG、SD2。基于深度学习的方法 :Tangram。基于最优传输(OT)的方法 :SpaOTsc、novoSpaRc。测试数据 收集了七个基于图像和基于测序的空间转录组数据集:seqFISH、MERFISH、空间转录组学(ST)、10X Visium(Visium)、Slide-seqV2和stereo-seq。其对应的单细胞转录组测序(scRNA-seq)数据集作为补充资源被收集(补充表1)。所有的整理好的数据和代码都可以在这里下载:https://zenodo.org/records/7674290
seqFISH+ : 单细胞和空转数据可以在这里下载 https://github.com/CaiGroup/seqFISH-PLUS.MERFISH: 单细胞数据 https://github.com/rdong08/spatialDWLS_dataset/tree/main/datasets, 空转数据 https://datadryad.org/stash/dataset/doi:10.5061/dryad.8t8s248/.ST : 单细胞和空转数据GSE111672.Visium : 单细胞和空转数据下载 https://github.com/BayraktarLab/cell2location.Slide-seqV2 : 单细胞和空转数据 https://github.com/dmcable/spacexr.Stereo-seq (olfactory bulb) : 单细胞数据 GSE71585, and 空转数据 https://db.cngb.org/stomics/mosta/.Stereo-seq (zebrafish embryo) : 单细胞和空转数据 https://db.cngb.org/stomics/datasets/STDS0000057.所有方法性能的评估总结 用可视化的方式展示了它们在准确性(红色)、鲁棒性(蓝色)和易用性(绿色)方面的表现,并且列出了每种方法对空间位置的要求、编程语言以及整体性能(灰色)。对于所有彩色点,颜色越深表示性能越好。在鲁棒性的归一化和超参数部分显示的黑点意味着这些方法仅需要原始计数作为输入的空间转录组数据,或者没有超参数可以调节。
每种方法的性能随着所使用的数据资源而变化,但有些方法在模拟数据集和真实世界数据集上都表现出稳定的高准确性,例如Cell2location和DestVI(图2)。
模拟数据的评估结果 使用模拟数据时:
大多数方法在MERFISH上表现良好,但只有CARD、DestVI和SpatialDWLS在seqFISH⁺上表现优异,表明它们在点位数量较少的情况下也能很好地工作。 当点位数量较多(即MERFISH和Slide-seqV2)时,Cell2location、SpatialDecon和Tangram最能对组织的大范围视图进行解卷积。 此外,SpatialDWLS在模拟数据集上表现良好,但在所有真实世界数据集上表现不佳。 seqFISH⁺中所有六种细胞类型和MERFISH中12个样本的全部细胞类型比例及其真实值在所有方法中进行了可视化(图3A、B) 鲁棒性评估 :通过多种实验条件评估了18种细胞解卷积方法的鲁棒性。表现最佳的方法 :CARD、Cell2location、Tangram和SD2在不同条件下表现最为稳健。最高效的方法 :NMFreg、STRIDE和Tangram在运行时间上表现最佳。用户友好性 :大多数方法满足了用户的基本需求,其中CARD、Cell2location、RCTD和DestVI表现尤为突出,提供了高质量的教程和易于实现的代码。用户指南 最后作者提供了一个指南用于指导用户可以根据自己的项目情况来进行方法选择: