13、基因相似性度量的相关性及特征选择研究

基因相似性度量的相关性及特征选择研究

在生物学研究中,基因相似性度量以及特征选择是非常重要的研究内容。基因相似性度量有助于我们理解基因之间的关系,而特征选择则能帮助我们从大量基因数据中提取关键信息。下面将详细介绍相关的度量方法、数据集分析以及研究结果。

1. GO术语相似性度量

在评估GO(Gene Ontology)术语相似性时,有四种常用的度量方法。其中前三种属于语义度量,最后一种基于基因本体图中两个GO术语之间的距离。
- 语义GO术语相似性度量
- 语义度量基于本体术语 $a \in A$ 的信息内容 $\tau(a)$ 的概念,其计算公式为:
- $\tau(a) = -\ln(P(a))$
其中,$P(a)$ 是术语 $a$ 的注释数量与分析基因数量的比率。
- Resnik提出的最简单的相似性度量方法,仅考虑比较术语 $a_i$ 和 $a_j$ 的共同祖先的信息内容 $\tau_{ca}(a_i,a_j)$,公式如下:
- $s^{(R)} A (a_i,a_j) = \tau {ca}(a_i,a_j)$
- Jiang - Conrath提出的更复杂的方法,术语距离定义为:
- $d^{(JC)} A (a_i,a_j) = \tau(a_i)+ \tau(a_j)-2\tau {ca}(a_i,a_j)$
- Lin提出的基于信息概念的最后一种度量方法为:
- $s^{(L)} A (a_i,a_j) = \frac{2\tau {ca}(a_i,a_j)}{\tau(a_i)+

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值