blast的替代品,使用hmmer寻找同源序列

在这里插入图片描述

hmmer,和blast类似,也是一款用于寻找同源序列的软件,其出现晚于blast,与blast所使用的算法不同,hmmer使用的是隐马尔科夫模型,隐马尔科夫模型的简介以及在序列比对中的应用我之前有写过一篇短文,有兴趣可以参读一下:隐马尔可夫模型在序列比对和基因预测中的应用。使用hmmer和blast各有长短,在某些情况下两者的效果差不多,有时候会有稍大差距。

hmmer也有在线版以及本地版,在线版由ebi维护,地址为https://www.ebi.ac.uk/Tools/hmmer/,hmmer官网为http://www.hmmer.org/,在此处可以找到hmmer的安装包,进行下载安装。

本文简要介绍一下,本地版hmmer的基本使用方式。


使用hmmer进行同源搜索之前

制作矩阵

hmmer的使用不同于blast,blast直接将query(查询)序列与目标基因组或者序列进行比对,而hmmer则是利用的其自身生成的矩阵来进行同源搜索,因此在正式开始搜索之前,需要首先根据query序列制作一个hmmer矩阵,制作hmmer矩阵的查询序列可以为多条,这些查询序列需要先进行多序列比对,多序列比对之后的结果再通过hmmer的工具hmmbuild来制作对应的矩阵。

若是只有一条查询序列,也是可以使用hmmbuild来制作矩阵的,但是可能没有使用多条查询序列找到的同源序列的结果多。同时hmmer中还有phmmer或者jackhmmer等工具,它们能够将一条序列作为查询序列直接搜索序列库,但我想其内部应该也是先根据这条传入的序列生成了矩阵后再进行同源搜索的。

hmmer生成矩阵后就能够用于在序列库中搜索与查询序列同源的序列了,这里要注意在hmmer中没有和blast一样的四种搜索方式(没有蛋白搜核酸以及核酸搜蛋白),hmmer中只能够进行核酸搜索核酸序列库或者蛋白搜索蛋白序列库的操作。若是要进行其它搜索,可能需要自行处理一下结果或者查询序列。

序列库

hmmer所搜索的target是序列库,而并不是整个传入基因组之类的。序列库也就是一个fasta文件,其中全是一条一条单独的序列,hmmer将对其中的每条序列进行同源搜索,以判断此序列是否和查询序列有同源性。因此若是有特定的序列想要判断其与查询序列的同源性,只需要将所有序列都放在同一个fasta文件中,这样就形成了一个hmmer可以查询的序列库。

在blast中,对某个基因组的搜索需要先将基因组制作为db形式(makeblastdb命令)。在hmmer中,也是不能直接搜索整个基因组的,因此要搜索的基因组就需要先被制作为序列库形式,这样的序列库可以通过一些预测基因组ORF的软件来完成,我最近使用到的就是prodigal这款软件,其使用比较方便,

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值