Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >使用CIRCexplorer2识别环状RNA

使用CIRCexplorer2识别环状RNA

作者头像
生信修炼手册
发布于 2019-12-19 07:11:04
发布于 2019-12-19 07:11:04
1.2K00
代码可运行
举报
文章被收录于专栏:生信修炼手册生信修炼手册
运行总次数:0
代码可运行

欢迎关注”生信修炼手册”!

CIRCexplorer是一款环状RNA预测软件,专门用于预测exonic circRNA,网址如下

https://github.com/YangLab/CIRCexplorer2

环状RNA的识别包含了序列比对和环状RNA预测两步,该软件目前更新到了v2版本,相比v1版本,用法有较大变化。在v1版本中只支持tophat-fusion和STAR两款软件进行序列比对来识别junction reads,在v2版本中,扩展到了以下5种软件

  1. Tophat-Fusion
  2. STAR
  3. BWA
  4. MapSplice
  5. segemehl

v1版本中所有命令封装在一个脚本中,v2版本也进行了改进,同时提供了单脚本一键化运行和分模块运行两种方式,保证了软件使用的简便性和灵活性。

该软件的安装相对而言,略显复杂,因为依赖的软件特别多,这里我直接把我在docker进行中的安装命令贴上来,供大家参考

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
docker run -it centos
yum install -y epel-release
yum install -y gcc gcc-c++  make zlib zlib-devel bzip2 bzip2-devel python2 python2-pip python-devel xz xz-devel unzip which ncurses-devel ncurses
# CIRCexplorer2
pip install circexplorer2
# tophat & tophat-fusion
wget http://ccb.jhu.edu/software/tophat/downloads/tophat-2.1.1.Linux_x86_64.tar.gz
tar xvzf tophat-2.1.1.Linux_x86_64.tar.gz
cd tophat-2.1.1.Linux_x86_64
cp b* c* f* g* j* long_spanning_reads map2gtf prep_reads sam* segment_juncs sra_to_solid tophat* /usr/local/bin/
# cufflinks
wget http://cole-trapnell-lab.github.io/cufflinks/assets/downloads/cufflinks-2.2.1.Linux_x86_64.tar.gz
tar xzvf cufflinks-2.2.1.Linux_x86_64.tar.gz
cp * /usr/local/bin/
# bedtools
wget https://github.com/arq5x/bedtools2/releases/download/v2.25.0/bedtools-2.25.0.tar.gz
tar -zxvf bedtools-2.25.0.tar.gz
cd bedtools2
make
cd bin
cp * /usr/local/bin/
# UCSC
wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/genePredToGtf
wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/gtfToGenePred
wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/bedGraphToBigWig
wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/bedToBigBed
chmod +x bedGraphToBigWig bedToBigBed genePredToGtf gtfToGenePred
mv  bedGraphToBigWig bedToBigBed genePredToGtf gtfToGenePred /usr/local/bin/
# star
wget https://github.com/alexdobin/STAR/archive/2.7.0d.tar.gz
tar xzvf  2.7.0d.tar.gz
cd STAR-2.7.0d/bin
cd Linux_x86_64_static
cp * /usr/local/bin/
# bwa
wget https://sourceforge.net/projects/bio-bwa/files/bwa-0.7.17.tar.bz2
tar xjvf bwa-0.7.17.tar.bz2
cd bwa-0.7.17
make
cp bwa /usr/local/bin/
# mapsplice
wget http://protocols.netlab.uky.edu/~zeng/MapSplice-v2.1.7.zip
unzip MapSplice-v2.1.7.zip
cd MapSplice-v2.1.7
make
# segemehl
wget https://github.com/samtools/htslib/releases/download/1.9/htslib-1.9.tar.bz2
tar xjvf htslib-1.9.tar.bz2
cd htslib-1.9
./configure
make
make install
wget http://www.bioinf.uni-leipzig.de/Software/segemehl/downloads/segemehl-0.3.4.tar.gz
tar xzvf segemehl-0.3.4.tar.gz
cd segemehl-0.3.4
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig/:$PKG_CONFIG_PATH
make
cp segemehl.x  /usr/local/bin/

相比安装,软件的使用过程就显得简单多了,该软件分为以下5个功能模块

  1. Align
  2. Parse
  3. Annotate
  4. Assemble
  5. Denovo

Align用于将序列比对到参考基因组上;Parse用于从比对结果中挑选junction reads;Annotate用于预测环状RNA;Assemble用于组装环状RNA的转录本序列;Denovo根据序列组装结果,识别新的环状RNA和分析环状RNA上的可变剪切事件。具体用法如下

1. Align

虽然支持多款序列比对软件,但是由于tophat的结果更方便后续的cufflinks软件进行分析,官方推荐使用tophat来进行比对。针对单端序列的比对,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
CIRCexplorer2 align \
-G hg19.gtf \
-i bowtie1_index \
-j bowtie2_index \
-f RNA_seq.fastq \
> CIRCexplorer2_align.log

值得注意的是,align模块仅提供了针对单端序列使用tophat进行比对的功能,如果你是双端测序的结果或者想要使用其他软件,只能是自己手工进行比对,这里比较推荐STAR软件,速度较快,缺点就是内存消耗较大。

2. parse

parse用于解析序列比对的结果,支持多款软件,以常用的STAR为例,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
CIRCexplorer2 parse \
-t STAR \
Chimeric.out.junction \
> CIRCexplorer2_parse.log

对于其他软件的用法,具体请参考官方文档,无论是什么比对软件,该命令最终都会生成以下文件

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
back_spliced_junction.bed
3. annotation

这一步就是根据已知的线性转录本信息,识别环状RNA,所以需要提供参考基因组对应的注释文件,官方也提供了脚本来帮助我们下载,用法如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
fetch_ucsc.py hg19 ref hg19_ref.txt

预测环状RNA的代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
CIRCexplorer2 annotate \
-r hg19_ref.txt \
-g hg19.fa \
-b back_spliced_junction.bed \
-o circularRNA_known.txt \
> CIRCexplorer2_annotate.log

-o参数为输出结果,内容示意如下

每列的含义如下所示

由于后续的两个模块只能处理tophat的结果,我用的是STAR测试的,所以这里就不描述其用法了。

如果你只是想要使用这个软件来预测环状RNA,那么多款序列比对软件都可以选择,但是你想要使用完整功能,则必须使用tophat来进行比对。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-02-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
CircRNA-seq上游分析工具测评:CIRIquant VS. CIRCexplorer3
本次测评CircRNA-seq上游分析的两大最新工具CIRCexplorer3及CIRIquant。CIRCexplorer3是2019年发表在Genomics Proteomics Bioinformatics(2020 IF=7.69)上,目前引用量是22次;CIRIquant2020年发表在nature communications上,目前引用量是54次。
生信技能树
2021/12/17
3.4K0
CircRNA-seq上游分析工具测评:CIRIquant VS. CIRCexplorer3
使用 Docker 分析高通量测序数据
做生信的童鞋想要学习 Docker,或者使用 Docker+Pipeline 封装自己的一套数据分析流程,相信一定不能错过胡博强老师在2017年写这篇《[Docker]使用阿里云 + Docker 分析高通量测序数据——RNA-Seq 与 ChIP-Seq. - Boqiang Hu》教程,这个教程同时也以推文的方式发布在了 2017-03-21 生信技能树公众号上,感兴趣的同学可以自己去翻一下。 根据教程+tangEpiNGSInstall 仓库提供的原始测试数据,本人这两天测试跑了一下,发现了一点点小问题。
章鱼猫先生
2021/10/15
5320
使用 Docker 分析高通量测序数据
使用CIRI识别环状RNA
在最初的环状RNA研究中,认为环状RNA都是由exon通过反向剪切构成的,称之为exonic circRNA,只有这样的环状RNA能够由PCR反应验证出来的。
生信修炼手册
2019/12/19
2K0
使用CIRI识别环状RNA
20220519_生物信息平台搭建及生物信息软件安装
20220519_生物信息平台搭建及生物信息软件安装 01 基础软件安装 基础软件安装 ============================================================================================ #java安装 apt-get install openjdk-8-jdk sudo add-apt-repository ppa:webupd8team/java
wilson_bit
2022/05/19
1.4K0
RNA-seq(4):下载参考基因组及基因注释
那下载哪个基因组呢?先了解一下: https://bitesizebio.com/38335/get-to-know-your-reference-genome-grch37-vs-grch38/
Y大宽
2018/09/10
5.3K0
RNA-seq(4):下载参考基因组及基因注释
使用find_circ识别环状RNA
circBase是环状RNA数据库的开山鼻祖,其中的环状RNA都是采用find_circ这个软件预测得到的。该软件的原理如下
生信修炼手册
2019/12/19
1.4K0
使用find_circ识别环状RNA
Juicer实战详解
Juicer软件的运行是非常简单的,只需要设置几个参数就可以了,本文利用官网的小的测试测试数据集来展示该软件的基本用法。
生信修炼手册
2019/12/20
2.8K0
熟悉数据库的下载
生物数据的处理本质上有两条路线:其中一条是序列本身具有结构特征,那么就可以通过软件算法来实现,比如预测基因,非编码 RNA,重复序列的分析等;另一条路线是序列本身没有结构特征,只能通过与已有序列进行比对,根据已知信息来推测未知信息,比如基因功能注释,16SrRNA 物种鉴定等,常见的一个例子就是得到一条序列,需要判断序列来自于哪个物种,就只能与数据库进行比对。
生信喵实验柴
2021/12/21
1.6K0
熟悉数据库的下载
Chip-seq上游分析流程学习(二)
本次分析步骤包括:环境部署——数据下载——查看数据(非过滤)——数据质控清洗——数据比对
凑齐六个字吧
2024/11/19
1970
Chip-seq上游分析流程学习(二)
一文读懂基因组浏览器绘制文件 bigwig
BigWig文件可以使用wigToBigWig程序从wiggle(wig)格式文件转换得到
生信菜鸟团
2021/12/10
4.2K0
一文读懂基因组浏览器绘制文件 bigwig
RNA-seq(5):序列比对:Hisat2
1 HISAT2官网下载 人类和小鼠的索引有现成的,HISAT2官网可以直接下载进行序列比对。如下图所示:选择hg19和mm10的index,文章中RNA-Seq测序数据,可以包括人类和小鼠的数据,因此需要小鼠和人类的索引。
Y大宽
2018/09/10
5.4K0
RNA-seq(5):序列比对:Hisat2
生信文件格式 | bigwig,bw (基因组浏览器绘制)
BigWig文件可以使用wigToBigWig程序从wiggle(wig)格式文件转换得到
白墨石
2021/01/12
6K0
使用circRNA_finder识别环状RNA
circRNA_finder是一款环状RNA预测软件,在对果蝇的研究中采用该软件进行了环状RNA的预测,该软件的源代码托管在github上,网址如下
生信修炼手册
2019/12/19
1.1K0
使用circRNA_finder识别环状RNA
一篇文章学会ChIP-seq分析(上)
写在前面:《一篇文章学会ChIP-seq分析(上)》《一篇文章学会ChIP-seq分析(下)》为生信菜鸟团博客相关文章合集,共九讲内容。带领你从相关文献解读、资料收集和公共数据下载开始,通过软件安装、数据比对、寻找并注释peak、寻找motif等ChIP-seq分析主要步骤入手学习,最后还会介绍相关可视化工具。 第一讲:文献选择与解读 文献;CARM1 Methylates Chromatin Remodeling Factor BAF155 to Enhance Tumor Progression and
生信技能树
2018/03/08
9.3K1
一篇文章学会ChIP-seq分析(上)
单细胞基因组拷贝数变异流程
这里一步到位下载bowtie2的参考基因组:http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml
生信技能树jimmy
2020/03/27
1.5K0
计算资源及编程-仅针对生信人员
理论上在个人Windows电脑上面做生物信息学数据分析是不实际的,因为太多的生物信息学相关软件的开发者对windows并不熟练,没办法提供完善的基于windows操作系统的软件。 而且个人Windows电脑配置肯定不会太高,一般的组学测序数据都是10~500G一个样本,而且很多软件运行的时候对内存要求很高,最后这些数据的分析过程会非常耗时,个人电脑在硬盘,内存,cpu方面均不足以承担这个重任。
生信技能树
2018/07/27
7800
计算资源及编程-仅针对生信人员
lncRNA实战项目-第四步-得到表达矩阵的流程
这是RNA-Seq 上游分析的大致流程,比对+定量。当然实验目的若只需要定量已知基因,也可以选择free-alignment 的流程工具如kallisto/Salmon/Sailfish,其优点是可用于RNA-seq的基因表达的快速定量,但是对于小RNA和表达量低的基因分析效果并不好(2018年刚发表的一篇文章对free-alignment 的工具进行了质量评估,doi: https://doi.org/10.1101/246967)。基于比对的流程,比对工具也有很多选择,如Hisat,STAR,Topha
生信技能树
2018/03/05
3.5K1
lncRNA实战项目-第四步-得到表达矩阵的流程
都2020年了你还在用tophat吗(RNA-seq数据免费分析)
如果你现在(2020)做人类数据分析,比如lncRNA的鉴定啥的,当然是走hisat2+stringTie流程啦,取代已经十多年了的tophat+Cufflinks流程。但是我这两天假期无聊刷文献,看到发表在Theranostics 2020,的研究文章:Long noncoding RNA PiHL regulates p53 protein stability through GRWD1/RPL11/MDM2 axis in colorectal cancer里面的RNA-seq数据居然还是在走十几年前的tophat流程哦,有趣,而且写的不清不楚那个FPKM是如何计算的。在广州锐博公司?
生信技能树
2020/02/20
1.5K0
从UCSC下载基因组的GTF文件
从UCSC下载基因组的GTF文件有两种方式,一种是利用table browser 浏览器,另外一种是通过FTP服务。
生信修炼手册
2020/05/08
6.5K0
从UCSC下载基因组的GTF文件
看优秀本科生如何一周内学会Linux进而搞定RNA-seq上游分析
我是武汉大学基础医学专业第一届的学生,2016年9月刚进大学的时候就选了导师进入实验室接受科研训练。虽然我们实验室不是专门做生物信息学的,但第一次和导师正式交流的时候,她就建议我要学点生信。(巧合的是2016年9月也是生信菜鸟团转型生信技能树的时间点,如果所有的导师都如此明智就好了)
生信技能树
2020/04/14
8.8K1
看优秀本科生如何一周内学会Linux进而搞定RNA-seq上游分析
相关推荐
CircRNA-seq上游分析工具测评:CIRIquant VS. CIRCexplorer3
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验