前一篇文章中给出了celrlanger定量的代码,虽然我发文的是一个失败案例(感兴趣的的同志们可以自行查看https://www.ncbi.nlm.nih.gov/Traces/study/?acc=PRJNA752099&o=acc_s%3Aa随便点开一个SRA可以看到它的data access下确实有三个fastq,只是作者上传时合并为了一个,所以需要下载SRA文件再生成fastq),但其他文件成功了,所以本篇文章从定量完成后开始。
我的习惯是在开始单细胞分析之前将上游所有项目跑完,所以今天就开始进行RNA速率分析。
mamba create -n velocyto python=3.9
mamba activate velocyto
conda install numpy scipy cython numba matplotlib scikit-learn h5py click
pip install pysam
mamba install -c bioconda samtools
pip install velocyto
velocyto -h
Velocyto需要两个参考文件:第一个包含在10x官网解压的参考文件内,第二个需要自行下载
勾选对应种族,版本下载即可。
gzip -d mm10_rmsk.gtf.gz
解压后即可得到mm10_rmsk.gtf文件
批量运行Velocyto
refpath=~/ARHL/MultiSet/refdata-gex-mm10-2020-A
datadir=/home/data/t060441/ARHL/MultiSet/upstream_download/sftl
samples=$(<sample.txt)
for s in ${samples};do
echo "${s} start at $(date)"
velocyto run10x -m mm10_rmsk.gtf \
${datadir}/${s} \
${refpath}/genes/genes.gtf
echo "${s} finished at $(date)"
done
下面解释一下几个路径
#sample.txt是含有要进行velovyto的样本名,有两种方法得出
ls SRR* | sed 's/_.*//' | sort | uniq > sample.txt
#将所有SRR开头的文件去重后写入sample.txt
ls -d */ > sample.txt
#读取工作目录下全部文件夹的名字(cellranger输出的结果)并写入sample.txt
#-m参数是下载的gtf文件,我直接解压在了工作目录下所以前面没加路径
#refpath:10x官网下载的参考文件解压得到的文件夹
#datadir:储存10x输出结果的文件夹
运行后即可得到loom文件,因为我的程序还在与运行,所以完成后再更新。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。