文章目录
随着Oxford Nanopore Technologies(ONT)测序平台的普及,越来越多的微生物多样性研究采用全长16S等扩增子进行高通量测序。QIIME2作为主流的微生物组数据分析平台,虽然DADA2不支持ONT数据,但通过vsearch聚类等方法,依然可以高效完成ONT扩增子数据的分析。本文以多样本分析为例,详细介绍如何用QIIME2处理ONT扩增子数据。
一、准备工作
1. 安装QIIME2
建议使用conda环境安装,具体可参考QIIME2官方文档。
确保已安装vsearch、feature-classifier等常用插件。
2. 准备数据和配置文件
- fastq文件:每个样本一个fastq,建议已完成basecalling和初步质控。
- manifest文件:记录样本名和fastq绝对路径,csv格式。
- metadata文件:样本分组信息,tab分隔。
manifest文件示例(all_sample_manifest.csv):
sample-id,absolute-filepath
FPSYSG_1_LXBR,/path/to/FPSYSG_1_LXBR.fastq
FPSYSG_2_LXBS,/path/to/FPSYSG_2_LXBS.fastq
...
metadata文件示例(sample-metadata.txt):
sample-id group
FPSYSG_1_LXBR FPSYSG_1_LXBR
FPSYSG_2_LXBS FPSYSG_2_LXBS
...
二、QIIME2分析流程
1. 数据导入
将fastq数据导入为QIIME2的artifact格式(.qza):
qiime tools import \
--type 'SampleData[SequencesWithQuality]' \
--input-path all_sample_manifest.csv \
--output-path demux.qza \
--input-format SingleEndFastqManifestPhred33V2
2. 去冗余(dereplication)
qiime vsearch dereplicate-sequences \
--i-sequences demux.qza \
--o-dereplicated-table table.qza \
--o-dereplicated-sequences rep-seqs.qza
3. OTU聚类(97%相似度)
qiime vsearch cluster-features-de-novo \
--i-table table.qza \
--i-sequences rep-seqs.qza \
--p-perc-identity 0.97 \
--o-clustered-table table-97.qza \
--o-clustered-sequences rep-seqs-97.qza
4. 去嵌合体
qiime vsearch uchime-denovo \
--i-table table-97.qza \
--i-sequences rep-seqs-97.qza \
--o-chimeras chimeras.qza \
--o-nonchimeras nonchimeras.qza \
--o-stats chimera-stats.qza
5. 物种注释
假设你有训练好的全长16S分类器(如SILVA):
qiime feature-classifier classify-sklearn \
--i-classifier silva-138-99-classifier.qza \
--i-reads rep-seqs-97.qza \
--o-classification taxonomy.qza
6. 结果可视化
qiime taxa barplot \
--i-table table-97.qza \
--i-taxonomy taxonomy.qza \
--m-metadata-file sample-metadata.txt \
--o-visualization taxa-bar-plots.qzv
7. 多样性分析(可选)
qiime diversity core-metrics \
--i-table table-97.qza \
--m-metadata-file sample-metadata.txt \
--output-dir core-metrics-results
三、注意事项与建议
- manifest文件必须为csv格式,且路径为绝对路径。
- metadata文件需为tab分隔,首行为sample-id。
- ONT数据建议先用NanoFilt等工具进行长度和质量过滤。
- 物种注释建议用全长16S数据库(如SILVA全长)。
- 如需ASV级别分析,推荐NanoCLUST、Emu等专用工具。
四、总结
通过上述流程,QIIME2可高效完成ONT扩增子数据的多样本分析,包括OTU聚类、去嵌合体、物种注释和多样性分析。只需准备好manifest和metadata文件,按流程执行即可获得高质量的微生物群落结构分析结果。
如需manifest文件自动生成脚本、分类器训练方法或下游R可视化代码,欢迎留言交流!