9、蛋白质功能位点识别中的字符串核方法

蛋白质功能位点识别中的字符串核方法

在蛋白质功能位点识别领域,有许多关键的技术和方法值得深入探讨。本文将详细介绍字符串核相关的技术,包括其原理、计算方法以及应用等方面。

1. 蛋白质功能位点识别的字符串核基础

在蛋白质功能位点识别中,有一个重要的公式用于计算判别能力,即 Fisher 比率:
[F(x_i) = \frac{|U_{A_i} - U_{B_i}|}{\sqrt{\sigma^2_{A_i} + \sigma^2_{B_i}}}]
其中:
[|U_{A_i} - U_{B_i}| = |E_A[h(x_j, x_i)] - E_B[h(x_k, x_i)]|]
[\sigma^2_{A_i} + \sigma^2_{B_i} = {E_A[h^2(x_j, x_i)] + E_B[h^2(x_k, x_i)]} - {[E_A[h(x_j, x_i)]]^2 + [E_B[h(x_k, x_i)]]^2]

该方法的基本步骤如下:
1. 使用上述 Fisher 比率计算所有子序列的判别能力。
2. 根据 Fisher 比率的值对所有子序列进行降序排序。
3. 从排序后的子序列中选择前 c 个子序列作为生物基础字符串集合 V。

需要注意的是,在非数值序列空间中,生物基础字符串之间的相似度应尽可能小,这样每个字符串才能在数值特征空间中代表一个独特的特征。

2. 新型字符串核函数

基于生物差异和生物基础字符串影响区域的概念,提出了一种新型字符串核函数。

2.1 生物差异的不对称性

定义两个子序列 (

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值