蛋白质结合位点残基关联与图像增强研究
蛋白质结合位点残基关联研究
在蛋白质研究领域,了解蛋白质的重要区域对于揭示其功能至关重要。那些能够与配体形成复合物的蛋白质位点,在功能上往往最为关键。然而,蛋白质数据库(PDB)中标记为“功能未知”的结构数量在1999年至2004年间几乎每年都增加两倍。
蛋白质功能预测方法
有研究采用自上而下的方法来解决蛋白质功能预测问题。例如,Shen等人仅使用序列数据,就能将给定蛋白质归类到酶委员会(EC)的主要类别中,如氧化还原酶、转移酶、水解酶、裂解酶、异构酶和连接酶,并且在EC类别预测上达到了超过90%的准确率。但本研究关注的是结合位点特征对酶功能的贡献。
利用结构信息预测蛋白质功能是一项具有挑战性的任务。一方面,基于序列的方法在大数据集上表现出色,如Shen等人的研究;另一方面,Bray等人使用294种非冗余酶进行酶类预测,准确率仅为33.1%。Bray等人和Dobson等人从催化位点图谱(CSA)中提取结合位点的结构特征,分析了六个主要EC分类组之间的序列和结构特征差异。
数据库介绍
- ZINC数据库 :这是一个免费的商业可用化合物数据库,用于虚拟筛选,包含约750,000个分子的库,每个分子都有3D结构并标注了分子性质。目前,ZINC为每个分子提供9种计算属性,如分子量、logP等。从ZINC数据库的SMILES符号中还可以计算出一些特征,如碳、氧和氮原子的数量等。
- 蛋白质配体相互作用数据库(PLID v1.1) :PLID v1.0由Reddy等人于2008年基于
蛋白质结合与图像增强研究
超级会员免费看
订阅专栏 解锁全文
32

被折叠的 条评论
为什么被折叠?



