模糊逻辑在生物信息学中的应用
模糊逻辑在蛋白质结构分类中的应用
在生物信息学领域,模糊逻辑有着重要的应用,尤其是在蛋白质结构分类方面。
首先介绍一种基于邻域操作的方法。有三种邻域操作:
- N1:在当前重叠区域插入一个随机比对。
- N2:在当前重叠区域插入两个随机比对。
- N3:将当前重叠区域的比对改为向左或向右。
随机选择一个邻域操作(所有操作概率相同)并应用于当前比对,这个过程重复 k 次(初始 k = 3)。如果所有邻域解(通过对当前重叠区域应用邻域操作生成的新重叠)都比当前解差(基于用户定义的模糊目标函数),则 k 值减 1。该方法先在邻域中探索好的解,若未找到更好的解,则进一步挖掘当前最优解。
对于球状蛋白质的结构分类,依据其二级结构组成可分为四大类:
| 类别 | 特征 |
| ---- | ---- |
| 全 - α 蛋白 | 含 >45% α - 螺旋且 <5% β - 链 |
| 全 - β 蛋白 | 含 <5% α - 螺旋且 >45% β - 链 |
| α + β 蛋白 | 含 >30% α - 螺旋和 >20% β - 链,且主要为反平行 β - 链 |
| α / β 蛋白 | 含 >30% α - 螺旋和 >20% β - 链,且主要为平行 β - 链 |
蛋白质的类别可以通过其氨基酸组成、残基的疏水性模式或 α - 螺旋/β - 链含量来确定。这里介绍一种使用氨基酸组成和模糊 c - 均值(FCM)聚类的方法。
设 S 为代表所有球状蛋白质的集合,
超级会员免费看
订阅专栏 解锁全文
1204

被折叠的 条评论
为什么被折叠?



