使用机器学习来测量基因间的相关性:一个多特征模型

本文提出了一种新的机器学习模型MFR,该模型通过整合表达相似度和基于先验知识的相似度,准确测量基因间的条件相关性。MFR使用带线性核的支持向量机,保留并推荐具有高表达相似性和高先验知识相似性的基因对。

1. 摘要

    测量一对基因间的条件亲缘关系是计算生物学的一项基本技术,也是一个重大的挑战。论文提出了一个新的机器学习模型—多特征相关性(MFR),通过将表达相似度和基于先验知识的相似度纳入评估标准,来准确地测量一对基因之间的条件相关性。

2. 介绍

    基因之间的相互作用通常被建模为一对基因之间0/1(非相互作用/相互作用)的二元关系,而亲缘性则意味着一对基因之间的某种程度的关系。

    相关性可以通过两种特征来衡量:表达相似度和基于先验知识的相似度。第一种特性通常是在一定条件下测量一对基因的共表达水平,第二种类型的特征通常是使用公共生物数据和功能注释数据库来测量基因的相关性。

    论文提出的机器学习模型MFR,通过使用带线性核的支持向量机,整合表达相似度和基于先验知识的相似度,保留并推荐具有高表达相似性和高先验知识相似性的基因对,准确地测量基因间的条件相关性。

3. 材料和方法

3.1 MFR工作流程

如图1所示,MFR工作流程有5个步骤:
(i) 从已发表的研究成果中收集基因对样本;
(ii) 从GEO、GO和orthoDB数据库中提取基因特征,用于评估基于相似性的基因对功能;

由于文章在服务器上,全文内容详见:http://bbit.vip/service/main.php?version=1&type=article&id=7

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值