使用机器学习来测量基因间的相关性:一个多特征模型

最新推荐文章于 2025-08-31 13:04:08 发布

原创最新推荐文章于 2025-08-31 13:04:08 发布 · 1.3w 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #python

生物信息学专栏收录该内容

30 篇文章

订阅专栏

本文提出了一种新的机器学习模型MFR，该模型通过整合表达相似度和基于先验知识的相似度，准确测量基因间的条件相关性。MFR使用带线性核的支持向量机，保留并推荐具有高表达相似性和高先验知识相似性的基因对。

1. 摘要

测量一对基因间的条件亲缘关系是计算生物学的一项基本技术，也是一个重大的挑战。论文提出了一个新的机器学习模型—多特征相关性(MFR)，通过将表达相似度和基于先验知识的相似度纳入评估标准，来准确地测量一对基因之间的条件相关性。

2. 介绍

基因之间的相互作用通常被建模为一对基因之间0/1(非相互作用/相互作用)的二元关系，而亲缘性则意味着一对基因之间的某种程度的关系。

相关性可以通过两种特征来衡量:表达相似度和基于先验知识的相似度。第一种特性通常是在一定条件下测量一对基因的共表达水平，第二种类型的特征通常是使用公共生物数据和功能注释数据库来测量基因的相关性。

论文提出的机器学习模型MFR，通过使用带线性核的支持向量机，整合表达相似度和基于先验知识的相似度，保留并推荐具有高表达相似性和高先验知识相似性的基因对，准确地测量基因间的条件相关性。

3. 材料和方法

3.1 MFR工作流程

如图1所示，MFR工作流程有5个步骤:
(i) 从已发表的研究成果中收集基因对样本；
(ii) 从GEO、GO和orthoDB数据库中提取基因特征，用于评估基于相似性的基因对功能;

由于文章在服务器上，全文内容详见：http://bbit.vip/service/main.php?version=1&type=article&id=7

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。