




参数 | 功能 | 默认值 |
|---|---|---|
cutoff | 基因表达量阈值(过滤低表达基因) | 0.1 |
min_cells_per_gene | 基因至少在多少细胞中表达 | 3 |
num_ref_groups | 参考细胞分组数(提高参考稳健性) | 3 |
参数 | 功能 | 默认值 |
|---|---|---|
window_length | 滑动窗口大小(基因数) | 100 |
smooth_method | 平滑方法("pyramidinal"或"runmeans") | "pyramidinal" |
max_centered_threshold | 中心化截断值(控制极端值) | 3 |
参数 | 功能 | 选项 |
|---|---|---|
cluster_method | 聚类算法 | "hclust"(层次聚类)或 "leiden"(社区检测) |
leiden_resolution | Leiden聚类的分辨率(值越大,亚群越多) | 1.0 |
hclust_method | 层次聚类方法("ward.D", "complete"等) | "ward.D" |
参数 | 功能 | 默认值 |
|---|---|---|
HMM | 是否运行HMM预测CNV状态 | FALSE |
HMM_type | HMM类型("i3"=3状态,"i6"=6状态) | "i3" |
tumor_subcluster_pval | 肿瘤亚群显著性阈值 | 0.1 |


参数 | 功能 | 默认值 |
|---|---|---|
min_genes | 每个细胞至少检测到的基因数 | 200 |
min_cells | 每个基因至少表达的细胞数 | 3 |
reference | 参考细胞类型(如免疫细胞) | None(需用户指定) |
参数 | 功能 | 默认值 |
|---|---|---|
window_size | 滑动窗口大小 | 100 |
smooth_rolling | 是否使用滚动平均平滑 | True |
max_val | 表达量截断值(防止极端值影响) | 3 |
参数 | 功能 | 选项 |
|---|---|---|
use_umap | 是否对CNV矩阵进行UMAP降维 | True |
use_tsne | 是否进行t-SNE降维 | False |
plot_interactive | 是否生成交互式热图(Plotly) | True |


参数 | 功能 | 默认值 |
|---|---|---|
spatial_weight | 空间平滑权重(0=仅基因组,1=强空间约束) | 0.5 |
neighborhood_size | 空间邻域范围(spot数量) | 6 |
detect_boundaries | 是否计算肿瘤边界 | True |
hotspot_pval | 空间CNV热点的显著性阈值 | 0.01 |
方法 | 适用数据 | 核心算法 | 关键功能 | 计算速度 |
|---|---|---|---|---|
inferCNV | scRNA-seq | 滑动窗口 + HMM | 层次/Leiden聚类 | 中等 |
inferCNVpy | scRNA-seq | 优化滑动窗口 | UMAP/交互式热图 | 快 |
SpatialInferCNV | 空间转录组 | 基因组+空间平滑 | 肿瘤边界、热点检测 | 中等 |

CNVkit 是一种灵活的工具,适用于 WGS 和 WES 数据,尤其擅长 靶向测序(如panel测序) 的CNV检测。其核心步骤包括:
参数 | 功能 | 默认值/选项 |
|---|---|---|
--method | 分段算法 | cbs(默认)hmm、none |
--drop-low-coverage | 过滤低覆盖区域 | False(建议WES设为True) |
--normal | 对照样本(用于归一化) | 需用户提供 |
--targets | 目标区域(BED文件) | 必须提供(WES/panel测序) |
--antitargets | 非目标区域(用于WGS) | 可选 |
--min-variant-depth | 最低支持深度 | 20 |
参数 | 功能 | 默认值/选项 |
|---|---|---|
--model | 模型选择 | POISSON(GermlineCNVCaller)、HMM(ModelSegments) |
--number-of-samples | 样本数(用于批次校正) | 需用户指定 |
--minimum-total-allele-count | 最低等位基因计数 | 10 |
--call-threshold | CNV调用阈值 | 0.5(log2 ratio) |
--kernel-variance | HMM核方差(影响灵敏度) | 0.25 |
VarScan2 最初设计用于 SNP/Indel检测,但其 copyCaller 模块可用于CNV分析:
参数 | 功能 | 默认值/选项 |
|---|---|---|
--min-coverage | 最低覆盖深度 | 20 |
--min-mean-rd | 最低平均测序深度 | 10 |
--p-value | KS检验显著性阈值 | 0.01 |
--data-ratio | 肿瘤/正常深度比值阈值 | 0.8(缺失)、1.2(扩增) |
--somatic-p-value | 体细胞CNV的p值阈值 | 0.05 |
工具 | 核心算法 | 适用场景 | 优点 | 局限性 |
|---|---|---|---|---|
CNVkit | CBS/HMM + 归一化 | WES/靶向测序 | 高灵敏度,支持无对照样本 | 依赖目标区域(WGS需额外参数) |
GATK | PLFM/HMM + 等位基因频率 | 种系/体细胞CNV | 高精度,整合GATK生态 | 计算量大,依赖正常对照 |
VarScan2 | KS检验 + log2比值 | 肿瘤-正常配对 | 计算快,统计检验严格 | 仅适用于配对样本 |
维度 | 单细胞/空间转录组 | 基因组(WGS/WES) |
|---|---|---|
数据基础 | 基于RNA表达量(间接推测CNV) | 基于DNA测序深度/结构变异(直接检测CNV) |
分辨率 | 单细胞级(~10μm空间分辨率) | 群体水平(混合细胞) |
覆盖范围 | 仅检测表达基因(受转录活性限制) | 全基因组/外显子组覆盖 |
方法 | 单细胞/空间转录组 | 基因组(WGS/WES) |
|---|---|---|
核心信号 | 基因表达异常(如高表达基因簇提示扩增) | DNA测序深度异常/断点检测 |
参考基准 | 依赖正常细胞表达谱(如免疫细胞) | 依赖对照样本或公共数据库(如1000 Genomes) |
算法重点 | 滑动窗口平滑 + 相对表达差异 | 统计模型(如HMM/CBS) + 读段分析(PE/SR) |
挑战 | 单细胞/空间转录组 | 基因组(WGS/WES) |
|---|---|---|
假阳性来源 | 转录噪声(如基因爆发表达) | 测序偏差(如GC含量/比对效率) |
灵敏度限制 | 仅能检测转录活跃区域的CNV | 可检测非编码区/沉默区域CNV |
空间特异性 | 可解析肿瘤微环境的空间异质性(仅空间转录组) | 无法提供空间信息 |
场景 | 单细胞/空间转录组 | 基因组(WGS/WES) |
|---|---|---|
肿瘤异质性 | 识别亚克隆结构 + 空间分布(如侵袭前沿) | 检测克隆性CNV驱动事件 |
遗传病研究 | 不适用 | 种系CNV检测(如微缺失综合征) |
技术互补性 | 需结合基因组数据验证功能性CNV | 提供金标准,但缺乏单细胞分辨率 |
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。