目录
BLAST(Basic Local Alignment Search Tool)是一种常用的生物信息学工具,用于比对核酸或蛋白质序列,以寻找相似性并推断两个序列之间的进化关系。
BLAST 可以在数据库中搜索序列,查找与查询序列最相似的序列,从而确定两个序列的相似性和进化关系。它通过比对两个序列的碱基或氨基酸组成,寻找相同的区域,并计算匹配度和相似性得分。
一、安装blast
1.Ubuntu环境
# 下载blast
wget https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.9.0/ncbi-blast-2.9.0+-x64-linux.tar.gz
# 解压blast压缩包
tar -xzvf ncbi-blast-2.9.0+-x64-linux.tar.gz
# 测试
./bin/blastp -h
这里就代表安装成功了,但是执行命令就有点麻烦需要用全路径的blastp运行,如果想直接用blastp还需要安装另一个插件:
apt install ncbi-blast+
这样安装成功之后才可以使用blastp命令
2.conda环境
如果你的环境是conda的,那安装blast就很简单了
conda install blast
一行命令搞定!
二、比对序列
BLAST(Basic Local Alignment Search Tool)可以用于比对序列的数据库有很多,其中一些常用的数据库包括:
-
NCBI(National Center for Biotechnology Information)提供的数据库,如:
- GenBank:包含已发布的核酸序列数据。
- RefSeq:包含参考序列数据,包括基因组、mRNA 和蛋白质序列。
- nr(Non-Redundant Protein Sequence Database):非冗余蛋白质序列数据库。
-
UniProt:包含了各种生物学和生物化学信息的综合性蛋白质数据库。
-
Ensembl:包含了多种物种的基因组数据和注释信息。
-
PDB(Protein Data Bank):包含了已知蛋白质的三维结构数据。
-
Swiss-Prot:是 UniProt 数据库中的一个子数据库,包含手工注释的高质量蛋白质序列数据。
除了上述数据库之外,还有许多其他公共和专业数据库可供 BLAST 使用,具体选择数据库取决于您的研究目的和需要比对的序列类型。在使用 BLAST 进行序列比对时,选择合适的数据库可以提高比对结果的准确性和可靠性。
1.创建数据库
# 运行这个命令创建数据库
makeblastdb -in 数据库.fa -dbtype prot
2.进行序列比对
blastp -query 自己的序列文件 -db 数据库.fa -out 输出的序列比对文件名.blast.out
三、总结
BLAST 常用于以下领域:
-
生物学研究:BLAST 可以帮助生物学家比对 DNA 或蛋白质序列,以研究生物进化和系统发育等问题。
-
基因组学研究:BLAST 可以帮助研究人员在基因组数据库中搜索和比对基因序列,以研究基因功能和基因组结构等问题。
-
药物研究:BLAST 可以帮助药物研究人员比对蛋白质序列,以寻找靶标蛋白并设计药物分子。
总之,BLAST 是一个非常有用的生物信息学工具,可以帮助生物学家、基因组学研究人员和药物研究人员等快速比对序列并进行分析。