Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >三代测序100问(6):ONT数据分析如何挑选最佳质控工具?

三代测序100问(6):ONT数据分析如何挑选最佳质控工具?

作者头像
天意生信云
发布于 2025-06-13 06:22:24
发布于 2025-06-13 06:22:24
700
举报

在上一期《三代测序100问》中,我们详细探讨了PacBio测序数据的质控策略与工具选择。今天,我们将目光转向另一长读长技术巨头——牛津纳米孔(ONT)测序平台,以及近期崭露头角的国产纳米孔测序仪。山东第一医科大学李冕博士指出,对于ONT及其同行而言,单链碱基质量的挑战曾是业界长期的“痛点”,因此,在数据分析前对这些数据进行严格的质量控制,显得尤为重要。

“无论数据来源于ONT自身,还是国产纳米孔平台,或是从公共数据库下载,拿到下机数据后的第一步,都必须是审慎地查看其质量状况。”李博士强调。虽然去年随着ONT最新试剂和Dorado等新版Basecaller模型的发布,单链读取的碱基质量中位数已实现了Q20+的突破(即准确度达到99%),但这并不意味着我们可以放松警惕。目前国产纳米孔平台单链读取的碱基质量整体仍维持在Q15-Q16左右(准确度约97%),这使得数据分析前的质量查看和过滤,成为确保后续结果可靠性的关键一环。

纳米孔数据质控的“利器”盘点

面对纳米孔测序数据的特性,市场上涌现出多款优秀的质控工具,它们各有所长,能够帮助研究者们全面评估数据质量,并进行必要的预处理:

  1. NANOPACK套件:纳米孔数据质控的经典之选

由比利时佛兰德斯生物技术研究所的Wouter De Coster团队开发的NANOPACK套件,是纳米孔数据质控领域最经典的质控工具。它能够满足不同层次的质控需求:

  • NanoPlot: 专为单个样本设计,能够生成详尽的测序质量报告和可视化图表,让你对数据概况一目了然。
  • NanoComp: 如果你有多个纳米孔样本需要比较,NanoComp则能同时对它们进行质量评估,方便你进行横向对比,快速发现批次效应或异常样本。
  • Chopper: 作为套件中的预处理工具,Chopper可以对测序数据进行修剪和过滤,去除低质量的碱基或短读长,为后续分析“精兵简政”。
  1. fastplong:长读长通用质控新星

在上一期我们推荐过、由开发二代数据质控神器fastp的OpenGene团队推出的fastplong工具,同样适用于纳米孔测序数据。“对于追求高效便捷的老师和同学们,fastplong绝对是值得信赖的‘一站式解决方案’。”李博士表示。它不仅能提供全面的质量统计,还能通过简洁的命令行操作,轻松完成数据过滤和修剪,并且支持conda一键安装,极大地简化了使用门槛。

  1. Bamboo:华大纳米孔数据的“定制工具”与更多可能

去年9月,华大集团发布了其自家的纳米孔测序仪CycloneSEQ-WT02和WY01,紧接着在10月推出了一款名为Bamboo的长读长数据质控工具。李博士在测试后对其赞不绝口:“Bamboo在统计指标和图表的丰富程度上表现非常优秀,同样集质量查看、修剪和过滤功能于一身。”

值得注意的是,Bamboo还能在有参考基因组的情况下,提供测序覆盖度的详细指标,这对于评估测序深度和均匀性至关重要。 “如果你的数据来自华大自家的纳米孔测序仪,那么Bamboo无疑是首选工具,毕竟‘自家’软件对自家数据有更深的优化。”李博士补充道,“当然,对于来自其他纳米孔测序仪的数据,如ONT、谱译、齐碳等,你也可以尝试使用Bamboo,因为质控软件的算法通常具有一定的通用性。”

质控:数据分析的“生命线”

李博士再次强调了数据质量控制的根本重要性:“数据分析领域有一句格言:‘Garbage in, Garbage out’。这意味着,无论后续的分析多么精妙复杂,如果输入的数据质量不过关,最终的产出也将大打折扣。”

因此,在着手进行基因组组装、结构变异检测、全长转录组分析等任何下游研究之前,务必确保你的纳米孔测序数据经过严格的质量评估和必要的预处理。 这是保障你的科研成果准确性、可靠性的“生命线”。

希望今天的分享,能帮助你在纳米孔测序数据的质控环节,做出最明智的工具选择,为你的后续分析打下坚实的基础!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-06-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 BioOmics 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
三代测序 - Oxford Nanopore (ONT) 数据分析 - 数据质控和过滤
当前ONT测序质量虽然有很大的改善,但准确性依然不及二代测序,例如illumina或者BGIseq等。2018-2019年主流芯片R9.4 准确率对于2D reads为94%,1Dreads仅为86% ,如下图Fig.2b所示(1)。
三代测序说
2023/11/21
8.9K9
三代测序 - Oxford Nanopore (ONT) 数据分析 - 数据质控和过滤
三代测序 - 数据质控 | Bamboo
深圳华大基因科技有限公司(华大集团)旗下公司杭州华大序风科技有限公司(CycloneSEQ-华大序风)于2024年3月21日注册成立,致力于通过纳米孔单分子测序技术的创新研发及落地应用。2024 年 9 月 9 日,在“登峰探极·生命可测”华大集团生命科学全球新品发布会上,华大集团 (华大智造)发布了名为 CycloneSEQ™ 的最新测序技术,并推出 CycloneSEQ-WT02(WT02,中文名“梧桐”)和 CycloneSEQ-WY01 (WY01,中文名“五岳”) 两款纳米孔测序仪(图1)。随后,在2025年3月1日的SEQ ALL联盟年度峰会上华大智造联合华大序风宣布G400-ER(更名后的CycloneSEQ-WY01)正式开售。
三代测序说
2025/05/20
1980
三代测序 - 数据质控 | Bamboo
三代测序100问(5):PacBio数据分析如何挑选最佳质控工具?
在前面的系列文章中,我们详细探讨了三代测序的选择策略、平台特性,以及PacBio数据中的HiFi与Subreads之辨。当这些前置知识都已融会贯通,测序数据也顺利到手——无论是从公共数据库下载,还是由测序服务公司交付——摆在每一位研究者面前的首要任务便是:如何对PacBio测序数据进行严谨的质量控制(QC)? 正如山东第一医科大学李冕博士所言,这是确保后续分析结果可靠性的基石。
天意生信云
2025/06/08
970
三代测序100问(5):PacBio数据分析如何挑选最佳质控工具?
全长转录组 | Oxford Nanopore (ONT) 三代全长转录组分析流程 -- 数据质控和预处理
ONT全长转录组测序是指基于牛津纳米孔公司(Oxford Nanopore Technologies,ONT)三代测序平台进行的全长转录组测序。利用三代测序平台长度长 (long-read)的特性,无需对转录本进行片段化,直接获取某一物种mRNA(或者有polyA尾的lncRNA)5'端到3'端的高质量全长转录组序列信息(图1),可准确识别可变剪接、基因融合、基因家族、可选择性多聚腺苷酸化 (alternative polyadenylation, APA)、等位基因特异性表达等转录本结构方面的变异。基于ONT三代测序平台进行全长转录组测序,除了可准确鉴别上述转录本结构变异,由于现阶段测序成本和通量(相对于PacBio平台),还可实现转录本(mRNA或polyA+ lncRNA)表达水平准确定量和差异分析。
三代测序说
2024/02/05
5.3K0
全长转录组 | Oxford Nanopore (ONT) 三代全长转录组分析流程 -- 数据质控和预处理
三代测序 - 数据质控 | fastplong
提起二代测序数据质控软件 fastp,相信大家一定不会陌生。作为一款质量控制软件,其从查看碱基质量到过滤、修剪、去接头等全方位的预处理服务,加之高速、易用的特点,在生物信息学领域赢得了广泛的好评。
三代测序说
2025/02/24
3591
三代测序 - 数据质控 | fastplong
三代测序 - 数据质控 | LongReadSum
LongReadSum 是美国费城儿童医院Kai Wang教授团队(图1)开发的一款专门针对长读长测序数据设计的快速质控工具(如纳米孔测序、PacBio测序等)。它支持多种文件格式,包括FASTA、FASTQ、BAM、POD5、FAST5和sequencing_summary.txt,能够快速生成HTML和文本格式的质控报告。无论是全基因组测序(WGS)、RNA-Seq,还是甲基化修饰的数据,LongReadSum都能轻松应对,其优点在于支持的数据格式多样。到目前为止最新版本v1.5.0更新于2025年1月23号。
三代测序说
2025/02/25
2070
三代测序 - 数据质控 | LongReadSum
三代测序技术100问(2):PacBio 与 ONT,谁是你的长读长利器?
在上一期(三代测序技术100问(1):NGS与第三代测序,如何做出明智选择?)中,我们厘清了二代与三代测序技术的适用边界,明确了选择需“因题施策”。然而,踏入三代测序的大门,新的抉择又摆在面前:目前市场上主流的长读长技术平台主要由两大阵营引领——美国的PacBio(Pacific Biosciences)和英国的ONT(Oxford Nanopore Technologies)。它们的技术原理、性能特点和应用侧重各有千秋,常常让研究者们,特别是准备首次尝试三代测序的团队感到选择的困惑。
天意生信云
2025/04/24
3100
三代测序技术100问(2):PacBio 与 ONT,谁是你的长读长利器?
三代测序100问(3):谁是你的天选三代测序商业服务商?
在前几期《三代测序100问》【三代测序100问:从“小白”到“大牛”,三代科研进程启动 、三代测序技术100问(1):NGS与第三代测序,如何做出明智选择?、三代测序技术100问(2):PacBio 与 ONT,谁是你的长读长利器?】中,我们一同探索了三代与二代测序的选择之道,也深入剖析了PacBio与ONT两大主流平台的特性。当理论的武器装备齐全,研究的蓝图也已绘就,一个很现实的问题便横亘在许多科研团队面前——如何选择一家靠谱的三代测序商业服务提供商? 正如山东第一医科大学李冕博士所言,这几乎是他被问及频率最高的问题之一:“李老师,帮我推荐一家三代测序公司呗?” 这个问题看似简单,实则关乎项目的成败,绝非三言两语就能轻易带过。今天,我们就跟随李博士脚步厘清这其中的门道。
天意生信云
2025/05/10
960
三代测序100问(3):谁是你的天选三代测序商业服务商?
CycloneSEQ-WT02测评系列(三):从原始数据到高质量细菌基因组组装
大家好!继发表了《华大序风测序仪开箱》和《上机测序实验》的文章之后,我们的CycloneSEQ-WT02纳米孔测序平台测评系列迎来了第三篇!今天,我们继续跟随山东第一医科大学李冕博士的脚步深入探讨CycloneSEQ-WT02初步测序结果基因组组装之后的质量,带大家从原始数据到高质量基因组组装的全流程,揭示这款测序仪如何助力科研突破!
天意生信云
2025/05/22
1420
CycloneSEQ-WT02测评系列(三):从原始数据到高质量细菌基因组组装
读书笔记 | 第二部分 NGS 介绍和数据分析
生信菜鸟团
2024/11/23
2590
读书笔记 | 第二部分 NGS 介绍和数据分析
使用纳米孔测序数据进行16S-DNA条形码研究的计算方法[综述]
3.Centrifuge和Minimap2是处理纳米孔数据的最合适工具,并且可以认为它们是当前的最佳选择;
用户1075469
2020/04/14
1.4K0
使用纳米孔测序数据进行16S-DNA条形码研究的计算方法[综述]
全长转录组 | ONT Direct RNA测序 (DRS) 技术原理、数据分析和应用
"牛津纳米孔技术公司(Oxford Nanopore Technologies,ONT)开发的第三代测序平台是 目前唯一能够直接对天然RNA链进行测序的技术平台。ONT - Direct RNA Sequecing (DRS,直接RNA测序)技术能够对天然全长RNA链进行测序,同时能够保留并检测RNA碱基的修饰信息,并能够相对准确地估算 poly(A) 尾的长度,从而还原RNA的真实特征。"
三代测序说
2024/08/08
2.2K0
全长转录组 | ONT Direct RNA测序 (DRS) 技术原理、数据分析和应用
二代测序数据的质控:你需要Trimmomatic!
通常质控需要我们自己写脚本来完成。Trimmomatic是一个便捷好用的Illumina测序数据质控工具,可以帮我们省掉很多代码任务,自发表以来引用量已过万,安装可以使用conda:
SYSU星空
2022/05/05
2.6K0
二代测序数据的质控:你需要Trimmomatic!
48小时超30Gb产出,N50破10Kb-实测华大CycloneSEQ-WT02实力革新
继上期开箱测评(【独家】全网首次国产三代测序仪开箱——华大序风WT02!)后,本次天意生信云继续联合山东第一医科大学李冕博士对华大智造(MGI)的CycloneSEQ-WT02纳米孔测序平台进行深入评测。本次测评选取了三株纯培养细菌,对其进行了从样本制备到数据产出的全面考察,核心结果显示:WT02在48小时内产出32.07 Gb高质量数据,读长N50达10.22 Kb。这篇报告将为您详细呈现评测过程与关键性能数据。
天意生信云
2025/04/29
1160
48小时超30Gb产出,N50破10Kb-实测华大CycloneSEQ-WT02实力革新
图解三代测序(Nanopore)
Reader :在自然界中,有一种可以嵌入到细胞膜中作为离子或分子通道的跨膜蛋白,具有天然的蛋白纳米孔。经过人为基因工程修饰后,得到的就是 Nanopore 测序所需的 Reader 蛋白。
白墨石
2021/02/05
4.1K0
都2025年了,谁还不会下一代测序(NGS)数据质控(二)
Trim Galore是一款开源的、基于命令行的工具,主要用于对测序数据(主要是FastQ格式的文件)进行自动化的接头去除和低质量碱基过滤。它结合了Cutadapt和FastQC两款工具的功能,既可以去除测序接头,也能进行质量控制。这款工具适用于高通量测序数据的预处理,特别是Illumina平台的双端和单端测序数据,以及RRBS(Reduced Representation Bisulfite-Seq)等特定类型的测序数据。
简说基因
2024/12/23
2250
都2025年了,谁还不会下一代测序(NGS)数据质控(二)
三代测序100问(4):拨开PacBio数据迷雾——Subreads, HiFi与CCS深度解析
在三代测序的浪潮中,PacBio SMRT测序技术以其独特的长读长和直接检测表观修饰的能力,为组学研究开辟了新的视野。然而,当研究者们,特别是初次接触者,从公共数据库(如NCBI SRA)下载PacBio数据之后常常会被文件名或样本注释中出现的“subreads”、“HiFi”、“CCS”等术语弄得一头雾水。
天意生信云
2025/05/23
1010
三代测序100问(4):拨开PacBio数据迷雾——Subreads, HiFi与CCS深度解析
都2025年了,谁还不会下一代测序(NGS)数据质控(三)
Trimmomatic是一款开源的工具,专门用于处理Illumina平台产生的FASTQ格式的测序数据。它的主要功能包括去除接头序列、剪除低质量碱基、滑动窗口修剪等,以提升后续分析的准确性和效率。Trimmomatic支持单端(SE)和双端(PE)测序数据的处理,能够有效地提升数据质量。
简说基因
2024/12/23
2210
都2025年了,谁还不会下一代测序(NGS)数据质控(三)
国产纳米孔测序黑马崛起!普译生物如何用"中国芯"打破国际垄断?
基因测序技术作为生命科学领域的核心底层技术,已广泛应用于基础研究、临床诊断、精准医疗等多个领域,对生物、医疗、农业、环保等行业产生了革命性影响。历经多次技术迭代,当前以高通量为特征的第二代测序技术仍是主流,而以长读长为主要优势的第三代测序技术(特别是被誉为“第四代测序技术”的纳米孔测序技术)正凭借其便捷、实时、低成本的特点快速崛起,并被《Nature Methods》列为2022年度科学方法。
天意生信云
2025/05/18
940
国产纳米孔测序黑马崛起!普译生物如何用"中国芯"打破国际垄断?
都2025年了,谁还不会下一代测序(NGS)数据质控(一)
fastp支持多种过滤和质量检测,包括检测质量曲线、碱基含量、Q20/Q30、GC含量、重复序列、接头等信息。它还能自动识别并切除接头,这在处理数据时非常方便。
简说基因
2024/12/23
1770
都2025年了,谁还不会下一代测序(NGS)数据质控(一)
推荐阅读
相关推荐
三代测序 - Oxford Nanopore (ONT) 数据分析 - 数据质控和过滤
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档