时至今日,微生物群落研究已全面进入测序分析阶段,当前研究主流处于二代扩增子与三代扩增子交接的时段。基于三代测序的菌群多样性组成谱分析能极大地提升物种分类鉴定的精确性和全面性,能更准确地还原样本中微生物群落的构成,实现“高分辨率”检测的同时,也为今后深入阐释菌群的代谢功能奠定了基础。
16S核糖体RNA(16S ribosomal RNA),简称16S rRNA,是原核生物核糖体中30S亚基的组成部分。16S rRNA基因存在于所有细菌的基因组中,长度约为1542 bp,包括 10 个保守区(Conserved region)和 9 个可变区(Variable region),保守区反映了物种间的亲缘关系,而可变区则反映了物种间的差异 (图1)。 16S rRNA基因,其分子大小适中,突变率小,是细菌系统分类研究中最有用的和最常用的分子标志。通过16S扩增子高通量测序,检测16S rDNA可变区的序列变异和丰度,可了解样品中微生物群落多样性和丰度信息,在微生物分类鉴定、微生态研究等方面起着重要的作用。
1990年,科学家们首次发现了环境样本中存在的16S rRNA序列(1),阐述了其研究潜力,自此开启了一个波澜壮阔的微生物群落研究时代。二代16S测序因其扩增片段极限长度仅500-600bp(双端overlap),因此对于二代扩增子挑选可变区是个大难题,挑选意味着妥协与信息丢失,如文章所示(3),属、种水平的未鉴定物种比例高 (图2)。三代16S扩增子测序,采用27F、1492R引物扩增全长片段(覆盖V1-V9区),则能够轻松覆盖16S总长约1500bp共9个可变区,最大程度保留了物种鉴定的可能性(图3)。
每一轮的技术革新都带来了研究思路上的改变,二代扩增子技术带来研究思路关注群落整体多样性变化、侧重门/属等水平微生物构成。三代扩增子技术则更进一步,更加关注不同组学间的关联,不仅关注门/属等水平物种丰度,也能够探索属内物种的协作/竞争关系 。有了如此高的分辨率表现,菌种级别的研究自然成为了研究重点,不同于过往对于二代16S科、属水平的研究,三代全长16S能够提供更全面且细致的菌株级别分析结果,让整个研究结果更贴近生态学功能,对于多组学关联以及后续课题实验指导、验证都有着巨大意义。从多组学关联的角度来看同样如此,更精细层面数据进行多组学关联往往能够揭示出更清晰的局部规律,这其中就有很多过往被忽略或无法触及的细节。
PacBio全长16S rRNA基因测序采用27F、1492R引物扩增全长片段(覆盖V1-V9区),采用PacBio SMRT测序平台CCS(Circular Consensus Sequencing)模式进行测序分析。PacBio SMRT测序具有许多明显优势:
HiFi Full-length 16S nextflow
分析流程旨在通过DADA2
和QIIME2
将全长16S Hifi序列聚类为高质量的Amplicon Sequence Variants (ASVs),进而完成后续的分析 。此流程基于QIIME2
,因此其能做的分析,如alpha多样性及beta多样性,物种注释和可视化,HiFi Full-length 16S分析流程均能够实现 (图5)。除了ASVs聚类,分析流程还能用vsearch
进行OTU聚类。
HiFi Full-length 16S 流程: https://github.com/PacificBiosciences/HiFi-16S-workflow
pb-16S-nt
文件夹:$ git clone https://github.com/PacificBiosciences/pb-16S-nf.git
pb-16S-nt
的文件夹。如果是校园网,遇到下载不下来的情况,可以去pb-16S-nt的github主页手动下载,然后上传服务器。pb-16S
分析流程以前,需要安装nextflow
和 conda
,备选singularity
或docker
。$ nextflow run main.nf --download_db
databases
的文件夹。databases
的文件夹,将下载文件放入其中。# 创建样本TSV文件,用来指定样本路径
$ echo -e "sample-id\tabsolute-filepath\ntest_data\t$(readlink -f test_data/test_1000_reads.fastq.gz)" > test_data/test_sample.tsv
# 测试数据,使用conda创建环境
$ nextflow run main.nf --input test_data/test_sample.tsv \
--metadata test_data/test_metadata.tsv -profile conda \
--outdir results
# 如果conda创建不了,可以尝试docker或singularity
$ nextflow run main.nf --input test_data/test_sample.tsv \
--metadata test_data/test_metadata.tsv -profile singularity \
--outdir results
conda
创建不了环境可以参考我在github上提出的解决方案:https://github.com/PacificBiosciences/HiFi-16S-workflow/issues/2。conda
创建环境还是不行,可以尝试 -profile docker
或 -profile singularity
。docker
或 singularity
, 第一次运行测试样本数据,需要下载镜像,等待时间较长。前提是需要安装SMRTlink。
在PacBio官网 Multiplexing Page 里下载 barcode 的 Fasta
文件 (图7)。
Sequel_16S_barcodes_for_192-Plex.fasta
文件上传至服务,放在opt/barcodes/
路径下,没有此路径可以自己创建。Data Management - Import Data - Select Barcodes (FASTA)
文件导入SMRTlink软件,后面拆分barcode使用(图8)。CCS
流程。Barcoded Sample File
,目的是将barcode和样本名称对应起来。Demultiplex Barcodes
流程将混样样本(hifi reads)拆分,SMRT Analysis - Creat New Analysis - Demultiplex Barcodes
,并按照图9设置。demultiplex.barcode组合.hifi_reads.fastq.gz
命名 (图10)。$ cat rename.txt
demultiplex.barcode组合.hifi_reads.fastq.gz newname1.fastq.gz
demultiplex.barcode组合.hifi_reads.fastq.gz newname2.fastq.gz
$ cat rename.txt | while read i j
>do
>mv $i $j
>done
根据要求制作metadata.tsv
和 sample.tsv
两个文件,就可以按照示例进行PacBio全长16S分析流程了。
$ nohup nextflow run main.nf --input 16S_project/sample.tsv \
--metadata 16S_project/metadata.tsv -profile conda \
--outdir 16S_project_results &
# 在获得rarefaction曲线后,可以指定rarefaction深度,重新跑程序
$ nohup nextflow run main.nf --input 16S_project/sample.tsv \
--metadata 16S_project/metadata.tsv -profile conda \
--outdir 16S_project_results \
-resume --rarefaction_depth 5000 &
具体的结果解读可以参照:https://github.com/PacificBiosciences/HiFi-16S-workflow/blob/main/pipeline_overview.md。
1.如果没有安装SMRTlink,barcode的拆分也可以使用lima。
#HiFi run from BAM with symmetric barcodes:
$ lima <movie>.hifi_reads.bam barcodes.fasta <movie>.demux.bam --hifi-preset SYMMETRIC
2.如果数据来自测序服务商,样本数据应该都是拆分好的,直接使用HiFi Full-length 16S分析流程分析即可。
Nextflow官网: https://www.nextflow.io/
#确保java11已经安装
$ java -version
#如果没有安装java,运行下面命令进行安装
#安装OpenJDK 11 JDK, centOS7服务器系统
$ yum install java-11-openjdk-devel
#安装nextflow
$ curl -s https://get.nextflow.io | bash
#nextflow 试运行
./nextflow run hello
#可以把nextflow加入到系统路径当中
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。