一般来讲,我们对测序数据进行QC,就三个大的方向:
Quality trimming
Adapter removal
Contaminant filtering
当我们是双端测序数据的时候,去除低质量的reads就容易导致左右两端测序文件不平衡,有一个比较好的软件能解决这个问题,而且软件使用非常简单!
安装代码如下:
这个软件很简单,就是去除低质量的reads,而且还可以保证双端测序的完整性。
http://www.biotrainee.com/jmzeng/reads/test1.fastq
http://www.biotrainee.com/jmzeng/reads/test2.fastq
这个软件支持gz压缩格式,我应该压缩好了再上传到我们的云服务器的,这样可以节省流量,这只是一个测试,如果数据传输压力太大了,我们可能会取消链接,改为百度云分享!
软件给出的log日志如下:
然后批量查看处理前后的fastqc质量报告:
比较所有的fastq文件的结果报告就可以看出它做了什么!
fastq
sickle处理前后的结果文件都可以在 http://www.biotrainee.com/jmzeng/sickle/sickle-results.zip 下载。
当然,这只是默认参数的用法,还可以添加很多参数! 比如 -q 30 -l 15 参数解释如下:
领取专属 10元无门槛券
私享最新 技术干货