blast formatdb 使用方法介绍

本文介绍了用于格式化核苷酸或蛋白质序列数据库的旧版软件工具formatdb及其替代品makeblastdb。formatdb用于准备数据库以供BLAST搜索使用,并详细解释了其命令行参数。同时,文章还介绍了BLAST+套件中的makeblastdb工具,提供了其参数详解及使用示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

formatdb is an outdated software tool in molecular bioinformatics to format protein or nucleotide databases for BLAST. It has been replaced by the tool makeblastdb and the NCBI "strongly encourage[s]" users to stop using formatdb.

The formatdb.exe program is part of the BLAST release, which can be found here:

ftp://ftp.ncbi.nih.gov/blast/executables/release/2.2.18

 

在对核苷酸或蛋白质序列数据库进行Blast搜索之前,必须要对所使用的序列数据库进行formatdb, 即对序列数 据库进行格式化,这是所有使用BLAST所必须的一步。

格式化序列数据库— —formatdb

formatdb 简单介绍

formatdb处理的都是格式为 ASN.1和 FASTA,而且不论是核苷酸序列数据库,还是蛋白质序列数据库;不论是使用Blastall ,还是Blastpgp,Mega Blast应用程序,这一步都是不可少的。

formatdb 命令行参数

它可以根据我们的想法把源数据库格式化

主要参数的说明

-i  输入需要格式化的源数据库名称 Optional

-p 文件类型,是核苷酸序列数据库,还是蛋白质序列数据库

        T – protein F - nucleotide [T/F] Optional

        default = T

-a 输入数据库的格式是ASN.1(否则是FASTA)

      T - True, F - False. [T/F] Optional

      default = F

-o 解析选项

      T - True: 解析序列标识并且建立目录

      F - False: 与上相反

      [T/F] Optional default = F

formatdb命令的参数说明

参数说明默认值备注
-t数据库的标题【可选】字符  
-i需要创建数据库的文件名文件名  
-l日志文件名文件名formatdb.log 
-p文件数据类型[T/F]TT – 蛋白质F – 核苷酸
-o解析选项[T/F]FT表示解析序列文件并产生索引文件,F则不解析
-a数据库文件是否为ASN.1格式[T/F]FT为是ASN.1格式
-bASN.1的模式[T/F]FT为二进制,F为文本模式
-eASN.1数据库的序列数[T/F]FT表示数据库中只有一条序列
-n重命名数据库文件的名称字符窜  
-v数据库卷的大小整数0单位:兆字符
-s限制索引的类型[T/F]FT为仅用接收号创建索引
-L创建数据库别名输出文件名  
-FGi列表的文件名输入文件 配合-L使用
-B生成的Gi二进制的文件名输出文件 配合-F使用

示例:

formatdb -i uniref100.fasta -n uniref100 -t uniref100 -l uniref100.log -p T
formatdb -i uniref90.fasta -n uniref90 -t uniref90 -l uniref90.log -p T
formatdb -i uniref50.fasta -n uniref50 -t uniref50 -l uniref50.log -p T

 

ftp://ftp.ncbi.nih.gov/blast/documents/formatdb.html

http://www.ncbi.nlm.nih.gov/staff/tao/URLAPI/formatdb_fastacmd.html

http://en.wikipedia.org/wiki/Formatdb

http://boyun.sh.cn/bio/?p=1483

http://code.google.com/p/mass-spec-gui/downloads/detail?name=formatdb.exe&can=2&q=

========================================================================================

BLAST+ 中包含的 makeblastdb 参数详解

与以前的Blast相以,我们还是从格式化数据库到比对开始

一般我们是有一个fasta文件用来格式化数据库,以前的命令是formatdb,现在是makeblastdb

一般用到的格式如下:

makeblastdb -in input_file -dbtype molecule_type -title database_title -parse_seqids -out database_name -logfile File_Name

-in  后接输入文件,你要格式化的fasta序列

-dbtype  后接序列类型,nucl为核酸,prot为蛋白

-title  给数据库起个名(不能用在后面搜索时-db的参数)

-parse_seqids  推荐加上,现在有啥原因还没搞清楚

-out  后接数据库名,自己起一个有意义的名字,以后blast+搜索时要用到的-db的参数

-logfile  日志文件,如果没有默认输出到屏幕

 

ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/  (download Blast+)

http://www.ncbi.nlm.nih.gov/books/NBK1763/

http://hi.baidu.com/lidaof/blog/item/fb4569cfc2011931f9dc612f.html

http://nebc.nox.ac.uk/bioinformatics/docs/makeblastdb.html

http://blast.ncbi.nlm.nih.gov/Blast.cgi

ftp://ftp.ncbi.nlm.nih.gov/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值