BLAST+使用方法

最新推荐文章于 2024-10-26 10:51:42 发布

转载最新推荐文章于 2024-10-26 10:51:42 发布 · 1.2w 阅读

生物信息学专栏收录该内容

19 篇文章

订阅专栏

转载自http://www.yelinsky.com/blog/

BLAST+与BLAST相比，有很多改进和提高，NCBI强烈推荐放弃BLAST，使用BLAST+，这里说的BLAST和BLAST+，都是本地的，与之前的那个批量BLAST小程序不是一回事。BLAST下载地址：NCBI BLAST+ 。BLAST+的一般用法如下：

格式化数据库
makeblastdb -in db.fasta -dbtype prot -parse_seqids -out dbname
参数说明:
-in：待格式化的序列文件
-dbtype：数据库类型，prot或nucl
-out：数据库名

蛋白序列比对蛋白数据库（blastp）
blastp -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8
参数说明:
-query：输入文件路径及文件名
-out：输出文件路径及文件名
-db：格式化了的数据库路径及数据库名
-outfmt：输出文件格式，总共有12种格式，6是tabular格式对应BLAST的m8格式
-evalue：设置输出结果的e-value值
-num_descriptions：tabular格式输出结果的条数
-num_threads：线程数

核酸序列比对核酸数据库（blastn）以及核酸序列比对蛋白数据库（blastx）
与上面的blastp用法类似：
blastn -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8
blastx -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8

以上的参数说明只是一些常用的参数，完整的参数说明可以用-help查询。