前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >使用GetOrganelle软件组装叶绿体基因组的简单小例子

使用GetOrganelle软件组装叶绿体基因组的简单小例子

作者头像
用户7010445
发布于 2021-03-15 01:57:55
发布于 2021-03-15 01:57:55
2.9K00
代码可运行
举报
运行总次数:0
代码可运行

今天的推文简单介绍一下使用GeOrganelle这款软件利用全基因组重测序数据组装叶绿体基因组的过程

现在做植物的叶绿体基因组基本上都是直接以新鲜叶片做材料,提取总DNA测序,构建二代测序文库,然后利用现成的软件组装叶绿体基因组,省去了提取叶绿体的步骤

利用总DNA测序的数据组装叶绿体基因组的软件很多,有一篇综述介绍这些工具

https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02153-6

今天这篇推文我使用 GetOrganelle 这个软件,软件的Github链接 https://github.com/Kinggerm/GetOrganelle

对应的论文

https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02154-5

软件的github主页对软件的使用方法介绍的很详细,这款软件是昆明植物所的老师开发的,还开设了qq群进行答疑,qq群号在gitbub的主页末尾可以看到

安装直接使用conda,非常容易

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
conda install -c bioconda getorganelle

想要在linux系统下使用conda命令需要安装miniconda或者Anaconda3,我之前录制过一期视频介绍linux系统安装 Anaconda3,不熟悉的可以找来看看 https://www.bilibili.com/video/BV1Ft4y1e7w2

软件安装好以后还得下载参考基因组,运行如下命令

组装用到的命令是get_organelle_from_reads.py,使用到的参数有

  • -1 -2 分别制定双端测序数据的路径
  • -o 制定输出文件的文件名
  • -R -k 具体是什么意思我还不知道,-R按照帮助文档直接设置15应该就可以,-k后面接的数字也可以按照他帮助文档的来设置,现在双端测序通常是150bp,这个-k参数直接设置105和121就可以,这个数字少一点,速度应该会快一点。
  • -F 指定参考,如果是叶绿体基因组后面直接跟 embplant_pt 就可以

因为叶绿体基因组的拷贝数高,基本上2G的数据量就够组装得到完整基因组用的了。所以直接用head命令取全基因组测序数据的前2千万行就够了

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
head -n 20000000 data_R1.fastq > R1.fastq
head -n 20000000 data_R2.fastq > R2.fastq

最后是组装

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
get_organelle_from_reads.py -1 R1.fastq -2 R2.fq -o plastome_output -R 15 -k 105,121 -F embplant_pt

如果组装成功最后会得到两条序列,这两条序列差别在小单拷贝区方向不同,我自己的处理方式是选一些近缘的参考叶绿体基因组来构建进化树,去掉枝长明显过长的那一个。

欢迎大家关注我的公众号

小明的数据分析笔记本

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-02-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
HLA-VBSeq:对全基因组数据进行HLA分型
HLA-VBseq 利用全基因组测序的数据,可以提供8位的HLA分型结果,其文献链接如下
生信修炼手册
2020/05/11
1.7K0
使用paragraph软件利用二代测序数据对已知结构变异(SV)进行基因型分型(genotyping)
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1909-7
用户7010445
2024/05/27
3570
使用paragraph软件利用二代测序数据对已知结构变异(SV)进行基因型分型(genotyping)
全基因组 | 三代长读长基因组组装 -- Flye
今天我们介绍一款用于三代长度长测序数据(如PacBio和纳米孔测序)的基因组de novo拼接工具 -- Flye,可用于进行小型细菌到哺乳动物基因组的组装。2019年04月01日,Flye发表于《Nature Biotechohnology》期刊上,题目为Assembly of long, error-prone reads using repeat graphs, 第一作者为当时在美国圣地亚戈加州大学Pavel A. Pevzner组里做博士后的Mikhail Kolmogorov博士(图1)。Mikhail Kolmogorov博士研究重点是计算生物学,包括算法、数学模型和工具,并且是长读长基因组组装工具Flye和metaFlye的首席开发人员,其现在就职于美国国家癌症研究所 (NIH-National Cancer Institute , Center for Cancer Research)。
三代测序说
2025/05/27
1080
全基因组 | 三代长读长基因组组装 -- Flye
文献笔记六十五:叶绿体基因组组装工具综述
The landscape of chloroplast genome assembly tools
用户7010445
2020/08/12
1.3K0
[Genome Biology | 论文简读] metaMIC:从头宏基因组组装的无参考错误组装识别和校正
metaMIC: reference-free misassembly identification and correction of de novo metagenomic assemblies
智能生信
2022/12/29
3260
[Genome Biology | 论文简读] metaMIC:从头宏基因组组装的无参考错误组装识别和校正
北大课题组报道单氨基酸精度绘制蛋白质功能图谱新方法
2019年12月16日,魏文胜课题组在Genome Biology杂志在线发表题为“PASTMUS: mapping functional elements at single amino acid resolution in human cells”的研究论文。
生信宝典
2019/12/25
4410
北大课题组报道单氨基酸精度绘制蛋白质功能图谱新方法
数据和代码公开的论文~藻类的群体遗传、叶绿体基因组和线粒体基因组
Phymatolithon calcareum, a maerl-forming red algal species
用户7010445
2021/07/12
5530
数据和代码公开的论文~藻类的群体遗传、叶绿体基因组和线粒体基因组
全基因组 | 三代长读长基因组组装 -- Canu
今天我们介绍一款用于三代长度长测序数据(如PacBio和纳米孔测序)的基因组de novo拼接工具 -- Canu,既适用于小基因组又适用于大基因组的组装,最早是为了应对低碱基质量(high-noise)的数据(如来自PacBio RSII/Sequel, ONT-MinION)。2017年3月15日,Canu发表于《Genome Biology》期刊上,题目为Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation,第一作者为美国国家人类基因组研究所(NHGRI)基因组信息学部门的Sergey Koren博士(图1)。他在基因组组装和单分子测序算法领域具有深厚的研究背景,开发了 Canu和 HiCanu等基因组组装软件,广泛应用于从微生物到人类的各种基因组组装项目。此外,他们还在 Telomere-to-Telomere(T2T)项目中担任领导角色(共1第2位),完成了首个完整(T2T)的人类基因组序列。
三代测序说
2025/05/29
1450
全基因组 | 三代长读长基因组组装 -- Canu
使用Circlator环化Ecoli基因组组装结果
PacBio reads:Assembly with command line tools
用户7010445
2020/03/03
2.5K0
【Genome Biology】四篇好文简读-专题2
SPARK-X: non-parametric modeling enables scalable and robust detection of spatial expression patterns for large spatial transcriptomic studies 论文摘要:
智能生信
2022/05/23
5010
【Genome Biology】四篇好文简读-专题2
HiC-Pro:灵活的Hi-C数据处理软件
HiC-Pro是一款高效的Hi-C数据分析软件,提供了从原始数据到归一化之后的HI-C图谱构建的完整功能,运行效率高,用法简便。该软件对应的文章链接如下
生信修炼手册
2019/12/20
2K0
宏基因组多样品的混合组装
Spades(http://cab.spbu.ru/software/spades/)可用于进行单细菌基因组组装,也能用于宏基因组测序数据,可以进行二代与三代测序数据的混合组装,也支持多样品组装。该工具在官网下载解压即可使用。
SYSU星空
2022/05/05
2.4K0
opitype:对HLA I型基因进行4位分型
HLAminer软件可以同时对HlA I型基因和II 型基因进行分型,但是分型结果中不可避免的会存在假阳性的结果。为了提高分型结果的准确性,不同的研究团队都在开发新的工具和算法,Opitype是一款专门针对HLA I型基因进行分型的软件,可以提供精确的4位分型结果。
生信修炼手册
2020/05/11
1.9K0
细胞器基因组组装利器~GetOrganelle~推荐组装命令介绍
GetOrganelle推荐组装命令介绍--reads开始 优先推荐的命令--auto(高等植物叶绿体基因组) get_organelle_from_reads.py -1 sample_1.fastq.gz -2 sample_2.fastq.gz -F embplant_pt -o output-plastome -R 10 -t 1 -k 21,45,65,85,105 命令中的参数说明 -1和-2 正向和反向测序原始数据文件 (如果是单向测序, -u) -F 设定要组装的基
用户7010445
2021/04/21
7.8K0
细胞器基因组组装利器~GetOrganelle~推荐组装命令介绍
k-mer分析:你的基因组有没有被污染?
k-mer分析常用的软件有Jellyfish、Kmergenie、KmerFreq和GCE等。其中Kmergenie常用于预测de novo组装中最优组装k-mer大小,根据reads分割k-mers并绘制k-mer深度分布曲线。Jellyfish分析准确度高,常用于判断基因组纯度、杂合度等。
SYSU星空
2022/05/05
3.5K0
k-mer分析:你的基因组有没有被污染?
hisat2:比对基因组工具简介
由于测序仪机器读长的限制,在构建文库的过程中首先需要将DNA片段化,测序得到的序列只是基因组上的部分序列。为了确定测序reads在基因组上的位置,需要将reads比对回参考基因组上,这个步骤叫做mapping。
生信修炼手册
2020/05/08
2.9K0
Canu | 三代测序数据组装软件②
Canu软件是Celera Assembler基因组组装软件的一个分支,能利用测序错误率较高的三代测序数据(PacBio或Nanopore)进行基因组De novo组装。该软件的命令行运行方法非常简单,运行速度较快且比较稳定,并能得到较好的基因组组装结果。
生信real
2022/08/18
1.8K0
使用lumpy进行CNV检测
每种算法都要其优势和不足之处,综合运用多种策略有助于提高检测的灵敏度,lumpy就是这样一款软件,集合了read-pair,split-read,read-depth, 等多种策略来预测CNV,文章链接如下
生信修炼手册
2019/12/19
2.8K0
使用lumpy进行CNV检测
pacbio及nanopore基因组拼接
Pacbio 测序数据与 nanopore 测序数据均为长读长测序,且二者数据质量类似,因此很多软件同时支持 pacbio 与 nanopore 数据,例如 canu,flye,wtdbg,miniasm,smartdenovo等软件均同时支持两种数据。但需注意如果 pacbio 测序为 hifi reads 模式,需要指定该模式。
生信喵实验柴
2022/05/23
1.5K0
spades基因组组装软件简介
spades这款de novo基因组组装软件, 适用于细菌/真菌等小型基因组的组装,不推荐用于动植物基因组的组装。该软件主要用于illumina,IonTorrent reads的组装,也可以进行PacBio, Oxford nanopore, Sanger reads的组装。
生信修炼手册
2020/05/08
3.8K0
推荐阅读
相关推荐
HLA-VBSeq:对全基因组数据进行HLA分型
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验