首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

假设你的fastq测序数据里面混入了非ascii 码字符

当然,这种情况实属罕见,一般来说这种情况说明你的fastq测序数据在传输压缩解压过程中出现了不可描述的错误。

当然,你可以先判断一下自己的fastq是什么规格的编码方式:

或者参考:https://www.drive5.com/usearch/manual/cmdfastqchars.html

首先检查是哪些地方混入了非ascii 码字符

假设检查到:

可以用sed命令看看该序列的啥情况

假设如下:

那我们就放心的用sed命令把这条序列的4行删掉即可。

但是,对双端测序不能这样任性的删除序列,可以把非ascii 码字符替换成正常的的ascii 码字符

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180106G00RY200?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券