TAXAassign v0.4 安装指南

TAXAassign v0.4 安装指南

TAXAassign v0.4 是一个基于 NCBI 分类系统的分类学注释工具,适用于对核酸序列(包括宏基因组组装片段、全基因组测序读段、16S rRNA 序列等)进行不同分类学层级的注释。

1. 环境需求
  • 操作系统:Linux 或 MacOS
  • 依赖工具:GNU Parallel、Blastn 2.28+、BioSQL、MySQL 或 SQLite、Perl 和 Python
2. 安装 GNU Parallel

GNU Parallel 用于并行化执行命令。可以从 GNU Parallel 官方网站下载并安装:

wget https://ftp.gnu.org/gnu/parallel/parallel-latest.tar.bz2
tar -xjf parallel-latest.tar.bz2
cd parallel-*
./configure && make && sudo make install
3. 安装 Blastn 2.28+ 和 NCBI 的 nt 数据库
  1. 下载并安装 Blastn 2.28+:

    wget https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.2.28/ncbi-blast-2.2.28+-x64-linux.tar.gz
    tar -xzf ncbi-blast-2.2.28+-x64-linux.tar.gz
    export PATH=$PATH:/path/to/ncbi-blast-2.2.28+/bin
    
  2. 下载 nt 数据库:

    使用 update_blastdb.pl 脚本下载最新的 nt 数据库:

    perl update_blastdb.pl nt
    
4. 安装 BioSQL 和设置数据库

BioSQL 用于存储 NCBI 的分类信息。可以使用 MySQL 或 SQLite 作为数据库。

  1. 安装 BioSQL:

    wget http://biosql.org/DIST/biosql-1.0.1.tar.gz
    tar -xzf biosql-1.0.1.tar.gz
    
  2. 设置 MySQL 数据库并导入 BioSQL schema:

    mysqladmin -u root create bioseqdb
    mysql -u root bioseqdb < biosql-1.0.1/scripts/biosqldb-mysql.sql
    

    这一步需要安装MySQL

  3. 导入 NCBI 分类数据:

    biosql-1.0.1/scripts/load_ncbi_taxonomy.pl --dbname bioseqdb --driver mysql --dbuser root --download true
    
  4. 使用 SQLite 数据库(可选):

    如果没有 MySQL,可以使用 SQLite。本地下载已准备好的 SQLite 数据库:

    cd /path/to/TAXAassign
    mkdir database && cd database
    wget http://userweb.eng.gla.ac.uk/umer.ijaz/bioinformatics/db.sqlite.gz
    gunzip db.sqlite.gz
    
5. 配置 TAXAassign

打开 TAXAassign.sh 脚本文件,设置以下参数:

# = Parameters to set ============== #
LOGFILE="`pwd`/TAXAassign.log"
BLASTN_DIR="/path/to/ncbi-blast-2.2.28+/bin"
BLASTDB_DIR="/path/to/ncbi-blast-2.2.28+/db"
FASTA_FILE=""
PARALLELIZE_FLAG=0
NUMBER_OF_CORES=10
NUMBER_OF_REFERENCE_MATCHES=10
MINIMUM_PERCENT_IDENT=97
MINIMUM_QUERY_COVERAGE=97
CONSENSUS_THRESHOLD=90
TAXONOMIC_LEVELS_THRESHOLD=""
# =/Parameters to set ============== #
6. 运行测试数据
  1. 准备测试数据:

    mkdir check_TAXAassign
    cp /path/to/TAXAassign/data/test.fasta check_TAXAassign/
    cd check_TAXAassign
    
  2. 运行测试:

    bash /path/to/TAXAassign/TAXAassign.sh -p -c 10 -t 70 -m 60 -a "60,70,80,95,95,97" -f test.fasta
    
7. 检查输出文件

检查生成的 CSV 文件,包括 test_ASSIGNMENTS.csvtest_PHYLUM.csvtest_CLASS.csv 等。test_ASSIGNMENTS.csv 的内容格式如下:

Sequence ID, Phylum, Class, Order, Family, Genus, Species

至此,TAXAassign 安装和运行已完成。如遇问题,可查看 TAXAassign.log 文件获取调试信息。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值