qiime2构建Silva138.2数据库

最新推荐文章于 2025-10-27 16:15:32 发布

原创最新推荐文章于 2025-10-27 16:15:32 发布 · 3.1k 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#数据库 #笔记

《虽然升级不难，但是过程也不平坦，可能以后也会有类似升级问题，为了提升之后的工作效率做个笔记记录一下子》！！

**1. 更新qiime2

扩增子如果用的是qiime2分析方法，可以参见qiime2官网的silva数据库获取途径

get-silva-data: Download, parse, and import SILVA database. — QIIME 2 2024.10.1 documentation

由于silva数据已经升级，相应的qiime2也应该升级为至少5以上的版本，具体如下

安装见官网：

Natively installing QIIME 2 — QIIME 2 2024.10.1 documentation

安装代码如下

##qiime2-amplicon-2024.10-py310-linux-conda.yml可手动下载
wget -c qiime2-amplicon-2024.10-py310-linux-conda.yml
conda env create -n qiime2-amplicon-2024.10 --file  qiime2-amplicon-2024.10-py310-linux-conda.yml
conda activate qiime2-amplicon-2024.10

**2. 通过qiime2获取silva数据库

export TMPDIR='/home/temp16s/' ##也可以不设置，默认在/tmp/目录下
source /home/miniconda3/bin/activate qiime2-amplicon-2024.10
#qiime rescript get-silva-data \   ## 耗时~30min
    --p-version '138.2' \
    --p-target 'SSURef_NR99' \
    --p-include-species-labels \
    --o-silva-sequences silva-138.2-ssu-nr99-rna-seqs.qza \
    --o-silva-taxonomy silva-138.2-ssu-nr99-tax.qza

# 转化格式:rna_dna
qiime rescript reverse-transcribe \  ## 耗时~4min
    --i-rna-sequences silva-138.2-ssu-nr99-rna-seqs.qza \
    --o-dna-sequences silva-138.2-ssu-nr99-seqs.qza


#剔除低质量序列（使用默认参数）
qiime rescript cull-seqs \
    --i-sequences silva-138.2-ssu-nr99-seqs.qza \
    --o-clean-sequences silva-138.2-ssu-nr99-seqs-cleaned.qza
#按长度和分类筛选序列
qiime rescript filter-seqs-length-by-taxon \
    --i-sequences silva-138.2-ssu-nr99-seqs-cleaned.qza \
    --i-taxonomy silva-138.2-ssu-nr99-tax.qza \
    --p-labels Archaea Bacteria Eukaryota \
    --p-min-lens 900 1200 1400 \
    --o-filtered-seqs silva-138.2-ssu-nr99-seqs-filt.qza \
    --o-discarded-seqs silva-138.2-ssu-nr99-seqs-discard.qza
#重复序列合并（使用默认参数）
qiime rescript dereplicate \
    --i-sequences silva-138.2-ssu-nr99-seqs-filt.qza  \
    --i-taxa silva-138.2-ssu-nr99-tax.qza \
    --p-threads 10 \
    --p-mode 'uniq' \
    --o-dereplicated-sequences silva-138.2-ssu-nr99-seqs-derep-uniq.qza \
    --o-dereplicated-taxa silva-138.2-ssu-nr99-tax-derep-uniq.qza

##训练分类器  ##耗时~692m38.569s
qiime feature-classifier fit-classifier-naive-bayes \
  --i-reference-reads  silva-138.2-ssu-nr99-seqs-derep-uniq.qza \
  --i-reference-taxonomy silva-138.2-ssu-nr99-tax-derep-uniq.qza \
  --o-classifier silva-138.2-ssu-nr99-classifier.qza

测试结果正常！！

总结：遇到问题可以优先查看官网，一些社区评论可能会有很多问题以及解决办法

如当用版本比较低的qiime2获取silva138.2时会报错，提示升级即可解决，如下

Issue with SILVA 138.2 and RESCRIPt Compatibility - General Discussion - QIIME 2 Forum

参考博文（链接见底部）：写的真的很全面，几乎可以照搬！！除了qiime rescript dereplicate模块中参数--p-rank-handles 'silva' \ ##不支持silva参数，可能是软件升级原因

##查看详细参数如下：可以不设置，默认即可
qiime rescript dereplicate -h

--p-rank-handles VALUES... List[Str % Choices('disable')] | List[Str %
    Choices('domain', 'superkingdom', 'kingdom', 'subkingdom', 'superphylum',
    'phylum', 'subphylum', 'infraphylum', 'superclass', 'class', 'subclass',
    'infraclass', 'cohort', 'superorder', 'order', 'suborder', 'infraorder',
    'parvorder', 'superfamily', 'family', 'subfamily', 'tribe', 'subtribe',
    'genus', 'subgenus', 'species group', 'species subgroup', 'species',
    'subspecies', 'forma')]
                          Specifies the set of rank handles used to backfill
                          missing ranks in the resulting dereplicated
                          taxonomy. Use 'disable' to prevent applying
                          'rank-handles'.
[default: ['domain', 'phylum', 'class', 'order', 'family', 'genus', 'species']]

基于Qiime2处理Silva数据库_silva数据库下载-优快云博客