《 虽然升级不难,但是过程也不平坦,可能以后也会有类似升级问题,为了提升之后的工作效率做个笔记记录一下子》!!
**1. 更新qiime2
扩增子如果用的是qiime2分析方法,可以参见qiime2官网的silva数据库获取途径
get-silva-data: Download, parse, and import SILVA database. — QIIME 2 2024.10.1 documentation
由于silva数据已经升级,相应的qiime2也应该升级为至少5以上的版本,具体如下
安装见官网:
Natively installing QIIME 2 — QIIME 2 2024.10.1 documentation
安装代码如下
##qiime2-amplicon-2024.10-py310-linux-conda.yml可手动下载
wget -c qiime2-amplicon-2024.10-py310-linux-conda.yml
conda env create -n qiime2-amplicon-2024.10 --file qiime2-amplicon-2024.10-py310-linux-conda.yml
conda activate qiime2-amplicon-2024.10
**2. 通过qiime2获取silva数据库
export TMPDIR='/home/temp16s/' ##也可以不设置,默认在/tmp/目录下
source /home/miniconda3/bin/activate qiime2-amplicon-2024.10
#qiime rescript get-silva-data \ ## 耗时~30min
--p-version '138.2' \
--p-target 'SSURef_NR99' \
--p-include-species-labels \
--o-silva-sequences silva-138.2-ssu-nr99-rna-seqs.qza \
--o-silva-taxonomy silva-138.2-ssu-nr99-tax.qza
# 转化格式:rna_dna
qiime rescript reverse-transcribe \ ## 耗时~4min
--i-rna-sequences silva-138.2-ssu-nr99-rna-seqs.qza \
--o-dna-sequences silva-138.2-ssu-nr99-seqs.qza
#剔除低质量序列(使用默认参数)
qiime rescript cull-seqs \
--i-sequences silva-138.2-ssu-nr99-seqs.qza \
--o-clean-sequences silva-138.2-ssu-nr99-seqs-cleaned.qza
#按长度和分类筛选序列
qiime rescript filter-seqs-length-by-taxon \
--i-sequences silva-138.2-ssu-nr99-seqs-cleaned.qza \
--i-taxonomy silva-138.2-ssu-nr99-tax.qza \
--p-labels Archaea Bacteria Eukaryota \
--p-min-lens 900 1200 1400 \
--o-filtered-seqs silva-138.2-ssu-nr99-seqs-filt.qza \
--o-discarded-seqs silva-138.2-ssu-nr99-seqs-discard.qza
#重复序列合并(使用默认参数)
qiime rescript dereplicate \
--i-sequences silva-138.2-ssu-nr99-seqs-filt.qza \
--i-taxa silva-138.2-ssu-nr99-tax.qza \
--p-threads 10 \
--p-mode 'uniq' \
--o-dereplicated-sequences silva-138.2-ssu-nr99-seqs-derep-uniq.qza \
--o-dereplicated-taxa silva-138.2-ssu-nr99-tax-derep-uniq.qza
##训练分类器 ##耗时~692m38.569s
qiime feature-classifier fit-classifier-naive-bayes \
--i-reference-reads silva-138.2-ssu-nr99-seqs-derep-uniq.qza \
--i-reference-taxonomy silva-138.2-ssu-nr99-tax-derep-uniq.qza \
--o-classifier silva-138.2-ssu-nr99-classifier.qza
测试结果正常!!
总结:遇到问题可以优先查看官网,一些社区评论可能会有很多问题以及解决办法
如当用版本比较低的qiime2获取silva138.2时会报错,提示升级即可解决,如下
Issue with SILVA 138.2 and RESCRIPt Compatibility - General Discussion - QIIME 2 Forum
参考博文(链接见底部):写的真的很全面,几乎可以照搬!!除了qiime rescript dereplicate模块中参数--p-rank-handles 'silva' \ ##不支持silva参数,可能是软件升级原因
##查看详细参数如下:可以不设置,默认即可
qiime rescript dereplicate -h
--p-rank-handles VALUES... List[Str % Choices('disable')] | List[Str %
Choices('domain', 'superkingdom', 'kingdom', 'subkingdom', 'superphylum',
'phylum', 'subphylum', 'infraphylum', 'superclass', 'class', 'subclass',
'infraclass', 'cohort', 'superorder', 'order', 'suborder', 'infraorder',
'parvorder', 'superfamily', 'family', 'subfamily', 'tribe', 'subtribe',
'genus', 'subgenus', 'species group', 'species subgroup', 'species',
'subspecies', 'forma')]
Specifies the set of rank handles used to backfill
missing ranks in the resulting dereplicated
taxonomy. Use 'disable' to prevent applying
'rank-handles'.
[default: ['domain', 'phylum', 'class', 'order', 'family', 'genus', 'species']]