前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >spades基因组组装软件简介

spades基因组组装软件简介

作者头像
生信修炼手册
发布于 2020-05-08 08:29:15
发布于 2020-05-08 08:29:15
3.8K00
代码可运行
举报
文章被收录于专栏:生信修炼手册生信修炼手册
运行总次数:0
代码可运行

欢迎关注"生信修炼手册"!

spades这款de novo基因组组装软件, 适用于细菌/真菌等小型基因组的组装,不推荐用于动植物基因组的组装。该软件主要用于illumina,IonTorrent reads的组装,也可以进行PacBio, Oxford nanopore, Sanger reads的组装。

官网如下

http://cab.spbu.ru/software/spades/

spades是一套软件,类似office办公软件系列,包含了以下5个可执行文件

  1. metaSPAdes
  2. plasmidSPAdes
  3. rnaSPAdes
  4. truSPAdes
  5. disSPAdes

metaSPAdes用于宏基因组数据的组装,plasmidSPAdes用于组装叶绿体/线粒体基因组,rnaSPAdes用于RNA-seq数据的组装,truSPAdes用于treseq barcode序列的组装,disSPAdes用于组装高杂合度的二倍体基因组。

软件的安装过程如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wget http://cab.spbu.ru/files/release3.12.0/SPAdes-3.12.0-Linux.tar.gz
tar xzvf SPAdes-3.12.0-Linux.tar.gz
cd SPAdes-3.12.0-Linux

直接从官网下载二进制包,解压缩就可以了。在bin目录下,有很多的可执行文件

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
./
├── dipspades.py
├── metaspades.py -> spades.py
├── plasmidspades.py -> spades.py
├── rnaspades.py -> spades.py
├── spades-bwa
├── spades-core
├── spades-corrector-core
├── spades-dipspades-core
├── spades-gbuilder
├── spades-gmapper
├── spades-hammer
├── spades_init.py
├── spades_init.pyc
├── spades-ionhammer
├── spades-kmercount
├── spades.py
├── spades-truseq-scfcorrection
└── truspades.py

其中spades.py 就是主要的提交脚本,该软件支持多种测序类型

  1. 单端数据 用--s1参数指定单独测序的序列文件,如果有多个文库,用数字后缀加以区分,比如--s1,--s2
  2. 双端数据 用--pe1-1--pe1-2分别指定双端测序的R1端和R2端序列文件,多个文库用数字后缀区分,比如--pe2-1, --pe2-2

基本用法如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
spades.py -k 21,33,55,77,99,127 --careful  --pe1-1 R1.fastq  --pe-2 R2.fastq  -o spades_output

输出结果目录会生成许多文件,其中scaffolds.fasta对应scaffold的结果,contig.fasta对应contig组装的结果。

扫描关注微信号,更多精彩内容等着你!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-08-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
宏基因组多样品的混合组装
Spades(http://cab.spbu.ru/software/spades/)可用于进行单细菌基因组组装,也能用于宏基因组测序数据,可以进行二代与三代测序数据的混合组装,也支持多样品组装。该工具在官网下载解压即可使用。
SYSU星空
2022/05/05
2.3K0
soapdenovo2进行基因组组装
基因组的的大小,杂合程度等因素都影响基因组组装的难易程度,目前市场上主流的有以下两种产品
生信修炼手册
2020/05/08
2.2K0
测序数据组装的常用工具
Spades(http://cab.spbu.ru/software/spades/)可用于进行单细菌基因组组装,也能用于宏基因组测序数据,可以进行二代与三代测序数据的混合组装,也支持多样品组装。输入数据可以是Illumina、IonTorrent或PacBio、Sanger测序结果,也可以把一些contigs序列作为long reads进行输入。该软件可以同时接受多组paired-end、mate-pairs和unpaired reads数据的输入。spades支持输入文件格式:fq、fastq、bam、fa、fasta、fq.gz、fastq.gz、bam.gz、fa.gz、fasta.gz,其使用方法如下所示:
SYSU星空
2022/05/05
3K0
测序数据组装的常用工具
ALLPATHS-LG基因组组装软件简介
ALLPATHS-LG 是由Broad Institiute研究所发明的一款基因组组装软件,不论是细菌/真菌等小型基因组,还是动植物等大型基因组的组装,它都能够胜任。 官网如下:
生信修炼手册
2020/05/08
1.2K0
ALLPATHS-LG基因组组装软件简介
使用GetOrganelle软件组装叶绿体基因组的简单小例子
今天的推文简单介绍一下使用GeOrganelle这款软件利用全基因组重测序数据组装叶绿体基因组的过程
用户7010445
2021/03/15
2.9K0
二代测序宏基因组拼接
基因组拼接一直是整个基因组数据分析中最重要和最核心的工作,因为基因组包含了一个物种全部的遗传信息。得到的基因组越完整,包含的基因组信息也越多,对于后续对整个基因组的功能分析,变异检测都有非常大的帮助。由于基因组本身具有的高度重复序列,多倍体杂合位点,低复杂度区域以及测序错误等诸多条件的影响,基因组拼接一直是一项非常复杂且困难的工作。尤其是基因组重复序列的影响,一直是二代短读长测序最难解决的问题,尽管后来基于二代测序数据开发除了一些辅助拼接方案,例如大片段文库,Optical mapping光学图谱,三位基因组等辅助方案,都无法彻底解决基因组拼接难题。而利用 nanopore 长度长测序,将革命性地解决重复序列对于基因组拼接的影响。
生信喵实验柴
2023/02/24
1.2K0
二代测序宏基因组拼接
二代测序宏基因组真实数据拼接
前面我们模拟混合了几种细菌的数据拼接,本次带来的是文献《Complete and validated genomes from a metagenome》中的数据,步骤就是下载数据,开始拼接。
生信喵实验柴
2023/02/24
1.1K0
二代测序宏基因组真实数据拼接
二代测序基因组拼接实战
该文章中对 20 个细菌基因组进行测序,每个样本分别进行了 illumina,pacbio 以及 nanopore测序。比较三种数据的拼接结果。其中两株细菌已包含发表出来的全基因组序列。
生信喵实验柴
2022/05/23
2.8K0
二代测序基因组拼接实战
使用SPAdes测序数据拼接软件拼装基因组
SPAdes 是由俄罗斯科学院 St. Petersburg Academic University 与美国科学家合作开发的主要应用于小型基因组如细菌,真菌等基因组测序数据的拼接软件。目前的最新版本 v3.6.2 可以支持常见的 illumina miseq/hiseq 和 ion torrent 测序数据,对单分子测序平台的 pacbio 和 nanopore 的测序数据也能进行拼装,还能进行混合数据的拼装。在 GAGE-B 的测拼里,在 Miseq 平台上的结果获得了最好的评价。
kongxx
2019/03/20
2.1K0
velvet软件进行基因组组装
默认情况下,velvet支持的kmer最大长度为31bp, 如果想要只会更大长度的kmer,在编译时需要设置MAXKMERLENGTH的值。编译完成后,会生成如下两个可执行文件
生信修炼手册
2020/05/08
1.5K0
HLA-VBSeq:对全基因组数据进行HLA分型
HLA-VBseq 利用全基因组测序的数据,可以提供8位的HLA分型结果,其文献链接如下
生信修炼手册
2020/05/11
1.7K0
基因组拼接探索
在之前介绍的基因组拼接,主要是二代illumina测序的拼接,其中使用不同的软件,及每个软件对应的不同的参数,会得到不同的结果,那么怎么选取软件和参数呢,下面着重介绍这些,当然取决于你的实验数据,从实际出发。可以测试部分小数据先看看结果,拼接多了就明白了。
生信喵实验柴
2022/05/23
3530
QUAST:评估基因组组装效果
对于不同kmer或者不同软件的基因组组装结果,我们通常会通过N50等指标来进行评估。
生信修炼手册
2020/05/08
6.8K0
QUAST:评估基因组组装效果
使用Circlator环化Ecoli基因组组装结果
PacBio reads:Assembly with command line tools
用户7010445
2020/03/03
2.5K0
全基因组 | 三代长读长基因组组装 -- Flye
今天我们介绍一款用于三代长度长测序数据(如PacBio和纳米孔测序)的基因组de novo拼接工具 -- Flye,可用于进行小型细菌到哺乳动物基因组的组装。2019年04月01日,Flye发表于《Nature Biotechohnology》期刊上,题目为Assembly of long, error-prone reads using repeat graphs, 第一作者为当时在美国圣地亚戈加州大学Pavel A. Pevzner组里做博士后的Mikhail Kolmogorov博士(图1)。Mikhail Kolmogorov博士研究重点是计算生物学,包括算法、数学模型和工具,并且是长读长基因组组装工具Flye和metaFlye的首席开发人员,其现在就职于美国国家癌症研究所 (NIH-National Cancer Institute , Center for Cancer Research)。
三代测序说
2025/05/27
850
全基因组 | 三代长读长基因组组装 -- Flye
细胞器基因组组装利器~GetOrganelle~推荐组装命令介绍
GetOrganelle推荐组装命令介绍--reads开始 优先推荐的命令--auto(高等植物叶绿体基因组) get_organelle_from_reads.py -1 sample_1.fastq.gz -2 sample_2.fastq.gz -F embplant_pt -o output-plastome -R 10 -t 1 -k 21,45,65,85,105 命令中的参数说明 -1和-2 正向和反向测序原始数据文件 (如果是单向测序, -u) -F 设定要组装的基
用户7010445
2021/04/21
7.8K0
细胞器基因组组装利器~GetOrganelle~推荐组装命令介绍
宏基因组binning:MetaBAT
基于reads比对注释的物种binning可以获得宏基因组微生物群落的物种组成信息,但无法获得组成物种的基因组。要获得这些基因组数据,还需要基于不同基因组的特征对拼接的contigs进行binning。目前基于contigs binning的方法使用非常广泛,也已经开发了多种软件,其中最高引用次数的两款为MaxBin和MetaBAT。这两款软件均支持使用多样本拼接的contigs来提高binning的成功率,也即根据contigs在多个library中丰度的相关性(co-abundance pattern)来进行聚类。
SYSU星空
2022/05/05
1.6K0
宏基因组binning:MetaBAT
宏转录组学习笔记--另一个教程
这项工作已获得Creative Commons Attribution-ShareAlike 4.0 International协议的许可。这意味着您可以复制,共享和修改作品,只要结果以相同的许可证分发即可。本教程由Mobolaji Adeolu(adeolum@mcmaster.ca),John Parkinson(john.parkinson@utoronto.ca)和Xuejian Xiong(xuejian@sickkids.ca)制作。
用户1075469
2020/03/31
3.1K0
宏转录组学习笔记--另一个教程
Abyss:基于布隆过滤器的基因组组装软件
主流的NGS基因组组装软件都是先将序列划分成kmer, 然后基于de Bruijn Graph图论算法,得到组装好的序列。程序运行时,kmer字符串时存储在内存中,所以要求计算机的内存要足够大。
生信修炼手册
2020/05/08
8220
全基因组 | 三代长读长基因组组装 -- Canu
今天我们介绍一款用于三代长度长测序数据(如PacBio和纳米孔测序)的基因组de novo拼接工具 -- Canu,既适用于小基因组又适用于大基因组的组装,最早是为了应对低碱基质量(high-noise)的数据(如来自PacBio RSII/Sequel, ONT-MinION)。2017年3月15日,Canu发表于《Genome Biology》期刊上,题目为Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation,第一作者为美国国家人类基因组研究所(NHGRI)基因组信息学部门的Sergey Koren博士(图1)。他在基因组组装和单分子测序算法领域具有深厚的研究背景,开发了 Canu和 HiCanu等基因组组装软件,广泛应用于从微生物到人类的各种基因组组装项目。此外,他们还在 Telomere-to-Telomere(T2T)项目中担任领导角色(共1第2位),完成了首个完整(T2T)的人类基因组序列。
三代测序说
2025/05/29
1060
全基因组 | 三代长读长基因组组装 -- Canu
相关推荐
宏基因组多样品的混合组装
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验