当然,这种情况实属罕见,一般来说这种情况说明你的fastq测序数据在传输压缩解压过程中出现了不可描述的错误。
当然,你可以先判断一下自己的fastq是什么规格的编码方式:
或者参考:https://www.drive5.com/usearch/manual/cmdfastqchars.html
首先检查是哪些地方混入了非ascii 码字符
假设检查到:
可以用sed命令看看该序列的啥情况
假设如下:
那我们就放心的用sed命令把这条序列的4行删掉即可。
但是,对双端测序不能这样任性的删除序列,可以把非ascii 码字符替换成正常的的ascii 码字符
领取专属 10元无门槛券
私享最新 技术干货