sra转fastq

原创

用户10455752

发布于 2024-07-12 11:58:38

1.1K0

文章被收录于专栏：单细胞单细胞

因为恰好遇到了PRJNA752099这个数据集，他上传的fastq文件被合并成了一个，所以我需要下载SRA文件重新拆分。正好作为上游最后一块的补充内容。

下载sratoolkit

wget --output-document sratoolkit.tar.gz https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-ubuntu64.tar.gz
tar -vxzf sratoolkit.tar.gz
export PATH=$PATH:$PWD/sratoolkit.3.1.1-ubuntu64/bin
faster-dump --help

我事先下载了PRJNA752099的4个SRA文件，所以这里从转fastq开始。

mkdir fastq_store
ls SRR* > list.txt
#sh脚本
samples=$(<list.txt)
for s in ${samples};do
   echo "${s} starts at $(date)"
   fasterq-dump ./${s} -O fastq_store -e 10 --include-technical -S 
   echo "${s} finished at $(date)"
done

这里解释一下faster-dump需要设置--include-technical才能读取barcode之类的reads，而且无法输出.gz格式的压缩文件，需要自行压缩。

运行完成后可以看到每个样本输出了3个fastq文件。

分别查看这几个文件，可以看到1是索引信息，2中是barcode，3是对应R2的长读

接下来只需要压缩后软链接到cellranger脚本路径下改名然后开始定量啦。

nohup gzip SRR*_1.fastq SRR*_2.fastq SRR*_3.fastq &

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

linux

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

linux

登录后参与评论

0 条评论

热度

sra转fastq

sra转fastq

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐