滴水穿石 非一日之功
前面我们介绍了如何在我们共享服务器零帧起手单细胞分析:玩转服务器—零帧起手单细胞上下游分析
示例运行使用的还是 cellrange 8.0
。其实在年初的2月6号,10x Genomics 已经推出了cellranger-9.0.1
版本,前面我们也在服务器上更新了相应的版本,同时使用中发现新增了一个有趣的参数,即支持了细胞注释。细胞注释模型[1]是由 10x Genomics 和 Broad Institute 数据科学平台的 Cellarium AI 实验室共同开发。该模型目前还处于测试阶段,仅支持有限物种。
服务器已支持的部分公共数据-用户可以直接调用或者拷贝
在 cellranger 9的 参数介绍页面[2],我们可以看到有一个细胞注释的选项:
对比cellrange8.0是没有这个可选参数的。
下面就来看看如何使用这个参数实现自动注释[3]:
首先需要有一个 10x Genomics Cloud Analysis 账户。不过注册账户的时候需要注意,这个功能是有区域限制的。
区域限制
这个区域限制应该就是数据合规性导致的。因为该功能是将数据传输到10x Genomics Cloud Analysis 实现的。了解到这一步,所以是否启用该功能,读者自行斟酌。
账户注册:https://cloud.10xgenomics.com/signin
注册账号
填写信息,因为区域限制的原因,所以在注册账号填写信息的时候,要避开限制区域,否则后续将无法进行。其余信息可以随意填写。
填写信息
之后就是一个多重验证的信息勾选,建议选择邮箱验证,国内邮箱即可。
登录账号之后,可以在 Security
选项找到 10x Genomics Cloud CLI Access Token 信息。至此第一步准备工作就完成了。
/home/data/t030659/biosoft/cellranger-9.0.1/cellranger cloud auth setup
信息交互
输入之前登录账号后,找到的 10x Genomics Cloud CLI Access Token 信息。
验证成功
如果不理解下面代码的可以参考前面的推文:
定量脚本内容如下:
$cat cellranger_count_homo_anno.sh
#! /bin/bash -xe
#
bin=/home/data/t030659/biosoft/cellranger-9.0.1/cellranger
db=/home/data/t030659/reference/refdata-gex-GRCh38-2024-A
ls $bin; ls $db
fq_dir=${2}
/usr/bin/time -v $bin count --id=$1 \
--localcores=4 \
--localmem=30 \
--transcriptome=$db \
--fastqs=$fq_dir \
--sample=$1 \
--create-bam=false \
--cell-annotation-model=human_pca_v1_beta \
--expect-cells=5000
提交后台运行,可以参考:玩转服务器—从前台到后台,让你的任务无忧运行
##提交后台运行
nohup bash /home/data/t030659/project/st0_script/cellranger_count_homo_anno.sh PBMC_598_Healthy /home/data/t030659/project/st2_data 1>log_PBMC_598_Healthy.txt 2>&1 &
#! /bin/bash -xe
#
bin=/home/data/t030659/biosoft/cellranger-9.0.1/cellranger
db=/home/data/t030659/reference/refdata-gex-GRCh38-2024-A
ls $bin; ls $db
out_dir=${2}
sample=${1}
/usr/bin/time -v $bin annotate --id=${sample} \
--matrix=${out_dir}/${sample}/outs/filtered_feature_bc_matrix.h5 \
--cell-annotation-model=auto
nohup bash cellranger_annotate.sh PBMC_598_Healthy /home/data/t030659/project/st3_outs 1>log_PBMC_598_anno.txt 2>&1 &
最后结果的web报告,除了常规的web_summary.html
,还多了一个 web_summary_cell_types.html
展示的大概注释,可以用来快速汇报展示。
常规web报告
web_summary_cell_types.html
web_summary_cell_types.html
web_summary_cell_types.html
web_summary_cell_types.html
--cell-annotation-model
参数如果没有注册 10x Genomics Cloud Analysis 账户,仅仅使用了上述修改后的代码,那么就会报错Failed to authenticate for Cell Ranger Cloud
。因为你没有提供token
[error] Failed to authenticate for Cell Ranger Cloud. Please run `cellranger cloud auth setup` to set up cloud authentication or provide a valid token via the --tenx-cloud-token-path parameter.
如果你没留意区域限制,使用了国内地址注册账号,那么在 Security
选项,你会发现找不到 10x Genomics Cloud CLI Access Token 信息