前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >BD Rhapsody上游定量流程

BD Rhapsody上游定量流程

作者头像
天意生信云
发布2025-04-01 11:10:06
发布2025-04-01 11:10:06
13100
代码可运行
举报
运行总次数:0
代码可运行

之前我们分享过10x平台的上游定量分析流程,本文将详细介绍BD Rhapsody平台进行单细胞转录组数据的上游定量分析流程。

1、环境准备:Docker的安装与配置

BD Rhapsody的分析流程依赖于Docker容器技术,确保了软件环境的一致性和可重复性。

安装docker :需要root权限(独享或者共享服务器)。

代码语言:javascript
代码运行次数:0
运行
复制
sudo apt-get update
sudo apt-get install ca-certificates curl gnupg

然后,添加Docker的官方GPG密钥并设置Docker仓库:

代码语言:javascript
代码运行次数:0
运行
复制
sudo install -m 0755 -d /etc/apt/keyrings
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg
sudo chmod a+r /etc/apt/keyrings/docker.gpg
echo"deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

最后,安装Docker Engine:

代码语言:javascript
代码运行次数:0
运行
复制
sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

验证Docker:运行以下命令以确认Docker已成功安装:

代码语言:javascript
代码运行次数:0
运行
复制
sudo docker run hello-world

用户权限设置:为避免每次运行Docker命令时都使用sudo,将当前用户添加到Docker组:

代码语言:javascript
代码运行次数:0
运行
复制
sudo groupadd docker
sudo usermod -aG docker $USER
sudo systemctl restart docker

2、准备参考基因组和GTF文件

参考基因组和GTF文件是转录组分析的基础,用于reads的比对和基因表达的定量。这些文件可以从BD官方文档提供的链接或Gencode等数据库下载。

http://bd-rhapsody-public.s3-website-us-east-1.amazonaws.com/Rhapsody-WTA/Pipeline-version2.x_WTA_references/

代码语言:javascript
代码运行次数:0
运行
复制
# 小鼠GRCm38参考基因组下载:
wget https://bd-rhapsody-public.s3.amazonaws.com/Rhapsody-WTA/Pipeline-version1.x_WTA_references/GRCm38-PhiX-gencodevM19/GRCm38-PhiX-gencodevM19-20181206.tar.gz
# 小鼠GRCm38GTF下载
https://bd-rhapsody-public.s3.amazonaws.com/Rhapsody-WTA/Pipeline-version1.x_WTA_references/GRCm38-PhiX-gencodevM19/gencodevM19-20181206.gtf

# 人类hg19参考基因组下载:
wget https://bd-rhapsody-public.s3.amazonaws.com/Rhapsody-WTA/Pipeline-version1.x_WTA_references/hg19/hg19-gencode.tar.gz
# 人类hg19 GTF:
https://bd-rhapsody-public.s3.amazonaws.com/Rhapsody-WTA/Pipeline-version1.x_WTA_references/hg19/hg19-gencode.gtf

3、 配置YML文件

YML文件是用于指定分析输入和参数的配置文件。BD Rhapsody提供了一个模板YML文件,根据自己的实验数据进行修改。

复制模板:首先,复制模板文件并重命名为my.yml:

代码语言:javascript
代码运行次数:0
运行
复制
cp template_wta_1.9.1.yml my.yml

编辑YML文件:使用文本编辑器打开my.yml,并根据以下关键部分进行修改:

Reads:指定FASTQ.GZ格式的测序数据文件路径。例如:

代码语言:javascript
代码运行次数:0
运行
复制
Reads:
  - class: File
    location: "/input/sample_R1.fastq.gz"
  - class: File
    location: "/input/sample_R2.fastq.gz"

如果是多个样本:

代码语言:javascript
代码运行次数:0
运行
复制
- class: File
   location: "/input/JZsc1641_S3_L003_R1_001.fastq.gz"
 - class: File
   location: "/input/JZsc1641_S3_L003_R2_001.fastq.gz"
 - class: File
   location: "/input/JZsc1672_S3_L004_R1_001.fastq.gz"
 - class: File
   location: "/input/JZsc1672_S3_L004_R2_001.fastq.gz"
 - class: File
   location: "/input/JZsc875_S18_L002_R1_001.fastq.gz"
 - class: File
   location: "/input/JZsc875_S18_L002_R2_001.fastq.gz"

Reference_Genome:指定STAR索引的路径(tar.gz格式)。例如:

代码语言:javascript
代码运行次数:0
运行
复制
Reference_Genome:
  class: File
  location: "/reference/GRCm38-PhiX-gencodevM19-20181206.tar.gz"

Transcriptome_Annotation:指定GTF注释文件的路径。例如:

代码语言:javascript
代码运行次数:0
运行
复制
Transcriptome_Annotation:
  class: File
  location: "/reference/gencode.vM31.primary_assembly.annotation-filtered.gtf"

其他参数:根据需要设置细胞计数、subsample和multiplex选项。

例如:

代码语言:javascript
代码运行次数:0
运行
复制
Exact_Cell_Count: 10000
Subsample: 0.01
Sample_Tags_Version: mouse

4、 运行CWL管道

CWL(Common Workflow Language)文件定义了分析流程,cwltool用于执行该流程。

安装CWL Runner:如果尚未安装cwltool,运行:

代码语言:javascript
代码运行次数:0
运行
复制
sudo apt-get update
sudo apt-get install cwltool

运行分析:使用以下命令在后台运行分析:

代码语言:javascript
代码运行次数:0
运行
复制
nohup cwl-runner \
  --outdir ./scRNA-out \
  rhapsody_wta_1.9.1.cwl \
  my.yml \
  2>&1 > test.log &

--outdir ./scRNA-out:指定输出目录。

rhapsody_wta_1.9.1.cwl:CWL文件路径。

my.yml:配置好的YML文件。

nohup和&:确保任务在后台运行。

5、 查看分析结果

分析完成后,结果将保存在./scRNA-out目录下。CRR1211169_Expression_Data.st就是我们所需要的稀疏矩阵。具体的输出文件和格式请参考BD Rhapsody的官方文档。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-03-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 BioOmics 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1、环境准备:Docker的安装与配置
  • 2、准备参考基因组和GTF文件
  • 3、 配置YML文件
  • 4、 运行CWL管道
  • 5、 查看分析结果
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档