利用本体和共享注释的语义及生物数据查询的共识排名方法
在生物研究和数据处理领域,如何有效利用数据中的语义信息以及优化查询结果的排名是重要的研究方向。本文将介绍两个相关的研究内容,一是利用本体和共享注释的语义来进行聚类和分析,二是通过查询重写和共识排名策略来优化生物数据的查询。
利用本体和共享注释的语义
- 相关定义
- 聚类密度定义 :给定一个双类型信息网络 (BG=(A_i \cup A_j, W_E)),(d) 是 (A_i) 和 (A_j) 元素之间的距离度量,(W_E) 的子集 (p) 的聚类密度 (cDensity(p) = \frac{\sum_{e=(a,b) \in p} 1 - d(a,b)}{|p|})。
- 注释签名分区问题 :对于双类型信息网络 (BG=(A_i \cup A_j, W_E)),距离度量 (d) 以及范围在 ([0.0:1.0]) 的实数 (\theta),当 (1 - d(a,b) > \theta) 时,存在边 (e = (a, b) \in W_E),且 (label(e)= 1 - d(a,b))。该问题旨在找到 (W_E) 的一个(最小)分区 (P),使得聚合聚类密度 (P_{AnnSig}(P) = \frac{\sum_{p \in P} (cDensity(p))}{|P|}) 最大。
- AnnSigClustering 算法
- 算
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



