1. 摘要
测量一对基因间的条件亲缘关系是计算生物学的一项基本技术,也是一个重大的挑战。论文提出了一个新的机器学习模型—多特征相关性(MFR),通过将表达相似度和基于先验知识的相似度纳入评估标准,来准确地测量一对基因之间的条件相关性。
2. 介绍
基因之间的相互作用通常被建模为一对基因之间0/1(非相互作用/相互作用)的二元关系,而亲缘性则意味着一对基因之间的某种程度的关系。
相关性可以通过两种特征来衡量:表达相似度和基于先验知识的相似度。第一种特性通常是在一定条件下测量一对基因的共表达水平,第二种类型的特征通常是使用公共生物数据和功能注释数据库来测量基因的相关性。
论文提出的机器学习模型MFR,通过使用带线性核的支持向量机,整合表达相似度和基于先验知识的相似度,保留并推荐具有高表达相似性和高先验知识相似性的基因对,准确地测量基因间的条件相关性。
3. 材料和方法
3.1 MFR工作流程
如图1所示,MFR工作流程有5个步骤:
(i) 从已发表的研究成果中收集基因对样本;
(ii) 从GEO、GO和orthoDB数据库中提取基因特征,用于评估基于相似性的基因对功能;
由于文章在服务器上,全文内容详见:http://bbit.vip/service/main.php?version=1&type=article&id=7
本文提出了一种新的机器学习模型MFR,该模型通过整合表达相似度和基于先验知识的相似度,准确测量基因间的条件相关性。MFR使用带线性核的支持向量机,保留并推荐具有高表达相似性和高先验知识相似性的基因对。
6万+

被折叠的 条评论
为什么被折叠?



