BLAST - 序列数据库搜索

本文介绍了生物信息学中Blast比对的基本概念及其重要性。通过北大生物信息公开课的学习资源,初学者能够快速掌握序列数据库搜索的方法,特别是BLAST算法的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我生信入门,老师就要求我学好blast比对,说得也确实是很有道理,是个人都知道比对是最基本的东西,现在再想想那老师的建议,也只能呵呵一笑。

北大生物信息公开课有一章专门讲得序列数据库搜索,可以好好看看,快速入门。

序列数据库搜索

 

 

BLAST算法

Basic Local Alignment Search Tool

 

BLAST使用

### PSI-BLAST 相关的数据库资源介绍 PSI-BLAST(Position-Specific Iterated BLAST)是一种迭代式的BLAST算法,能够更敏感地检测远缘同源关系。为了支持这种高级功能,多个数据库和服务提供了必要的数据和工具。 #### 1. NCBI 数据库及其FTP站点 国家生物技术信息中心(NCBI)提供了一系列可搜索数据库,这些数据库可以在其网站上访问,也可以通过FTP下载[^2]。对于希望使用预格式化版本而非原始FASTA文件的研究人员来说,这尤其有用。这类数据库不仅体积较小,而且包含了每条序列对应的分类学信息以及索引标识符,有助于提高查询效率。 #### 2. TMBASE 跨膜蛋白数据库 虽然TMBASE主要是一个专注于跨膜蛋白质的数据集合[^1],但它同样可以作为PSI-BLAST分析的一个潜在目标库之一。特别是当研究涉及特定类型的膜结合分子时,这个专门化的资源可能特别有价值。 #### 3. Entrez检索服务中的PDB结构数据 除了上述提到的一般性序列数据库外,来自NCBI Entrez系统的三维结构记录也值得考虑[^3]。尽管这不是直接针对PSI-BLAST设计的服务,但在进行进化保守区域预测或其他基于结构的功能推断时,此类资料能起到辅助作用。 ```python from Bio.Blast import NCBIXML result_handle = open("psi_blast_results.xml") blast_records = NCBIXML.parse(result_handle) for record in blast_records: for alignment in record.alignments: title = alignment.title[:80] print(f"Title: {title}") ``` 此Python脚本展示了如何解析由PSI-BLAST产生的XML输出文件,并提取其中的部分信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值