使用VSEARCH处理双端测序数据
一般情况下,我们从ENA获取的数据为双端测序数据,而且已经去除了引入,那么如何从测序数据获得丰度数据呢?可以使用的软件有VSEARCH、USEARCH以及QIIME等。本文以VSEARCH为例,从输入双端测序序列到最终OTU表的生成。
#!/bin/bash
### 使用VSEARCH处理双端测序数据
### 目标是得到OTU表和注释信息
#########################################
# 目录 #
# data/:双端测序数据:如PRJEB9708 #
# database/:参考数据库 #
# temp/:临时文件 #
# res/:最终结果 #
# err/:错误信息 #
# log/:日志 #
#########################################
# 文件说明
# SequenceDataProcess_byVSEARCH.sh :分析主流程(shell脚本)
# rdp_16s_v16.fa :16s数据库
# data/*/*.fastq.gz : 压缩的原始测序数据
#############################################################
# 定义路径
HOME=$HOME/Lab_2
data=$HOME/data
refdb=$HOME/database