Hello,大家好,上周我们的MinION运行了两天两夜终于顺利完成了第一次nanopore 测序。接下来就到了对原始数据的处理环节。因为nanopore 产生的长序列不同于illumina测序的短序列,所以像FastQC (Babraham Bioinformatics 2010, https://www.bioinformatics.babraham.ac.uk/projects/fastqc/) 这种为illumina测序较短读长及极高准确度的序列量身定做的分析工具不再适用于nanopore 的序列分析。
因此这一周以来我都在寻找并学习针对nanopore测序序列分析处理的软件,其间走了很多弯路,犯了很多错误,也学到很多东西。现在就把这些经验分享给大家,让大家在接触到类似数据、使用类似工具的时候能少走弯路。
本文分为三个部分:
一、NanoPack工具介绍
二、准备条件
三、Ubuntu 操作系统上NanoPack的安装
一
NanoPack工具介绍
Nanopack(https://www.biorxiv.org/content/early/2017/12/21/237180)与其说是一个软件,不如说是一个软件包,其中包含NanoPlot , NanoComp , NanoQC , NanoStat , NanoFilt , NanoLyse 六个脚本及 nanoget , nanomath , nanoplotter 三个模块。是专门针对nanopore测序产生的原始数据进行处理的软件。
说了这么多,它能进行哪些数据处理呢?不罗嗦,直接上图:
图1:NanoPlot 总体统计
图2:序列读长统计直方图
图3:序列读长的加权直方图
图4:序列读长对数转换对比
以上图片展示的仅是NanoPlot 和 NanoComp 脚本生成的一小部分图片,非常全面的统计结果。
当然还有其他脚本不需要图片来表达,比如NanoFilt 用于设定最小长度,最小质量截止值,最小和最大平均GC值来过滤fastq文件;NanoLyse用于过滤fastq文件的流式脚本,可去测序序列中λ噬菌体基因组(在nanopore测序中使用的control DNA)的序列。
二
准备条件
1. nanopore测序产生的原始数据,我们使用的是fastq格式文件。
2. 一台Linux 系统电脑,当然使用服务器更好。我们使用的是一台Ubuntu 16.04 系统的台式机。
三
Ubuntu 操作系统上NanoPack的安装及使用
为方便没有接触过的同学轻松学习,这部分介绍会比较详细,大神请绕道。
1. 获取系统root权限,一个简单的命令:
2. 因为NanoPack 是基于Python3 编写的程序,所以正常运行需要Linux系统配置Python3环境变量,可以下面命令查看自己的系统是否已经安装了Python3:
出现上图所示的信息则表示系统已配置了python3, 否则需要先安装python3(ps:Python2 和Python3 可以在同一系统兼容,安装Python3 无需卸载Python2,Python3的安装也不会覆盖Python2)。如果已经安装好了Python3,请直接跳至第8步。
3.如果没有安装python3, 则首先下载Python3安装包:
4. 等待下载完成,解压文件:
5. 进入解压出的文件夹,添加配置,配置自己的安装目录,即在下图命令中 –prefix= 后更改自己确定的安装目录,不建议直接安装在/usr/bin/,因为这是系统默认的Python2 的安装目录,容易产生混淆:
6. 安装:
7. 建立软链接,再次尝试pythons3 命令:
细心的同学可能会发现,这张图片中的Python 3 就已经更新到3.6.5 的版本,而非第二张图片中的Python 3.5.2 版本,说明我们覆盖安装成功了。
8. 如果已经安装了python3, 我们就直接安装pip模块:
9. 安装setuptools模块:
10. 安装其他各种可能需要的软件:
使用命令:apt-getinstall build-essential autoconf libtool pkg-config python-opengl python-imaging python-pyrex python-pyside.qtopengl idle-python2.7qt4-dev-tools qt4-designer libqtgui4 libqtcore4 libqt4-xml libqt4-test libqt4-script libqt4-network libqt4-dbus python-qt4 python-qt4-gl libgle3 python-dev libssl-dev
11. 安装文献中明确提及的第三方模块:
12. 安装NanoPack:
好了,到这里我们的安装就完成了,可以使用NanoPack包内的各种工具了。
感兴趣的同学遇到问题可以一起交流。
谢谢大家的阅读,祝大家生活愉快、实验顺利!
作者:进化基因组学实验室
2017级动物学硕士研究生 李超
长按下方二维码关注我们
编辑:进化所宣传组
领取专属 10元无门槛券
私享最新 技术干货