7、用于药物 - 疾病关联预测的高潜力负采样方法

用于药物 - 疾病关联预测的高潜力负采样方法

1. 引言

探索和开发新药是一个复杂且成本高昂的过程,不仅需要大量的资金和时间投入,还伴随着较高的失败风险。据报道,将一种新的小分子药物推向市场可能需要花费 3.1 亿至 28 亿美元,耗时约 10 至 17 年,且一期临床试验的失败率接近 90%。

在这样的背景下,药物再利用成为了一个备受关注的策略。药物再利用是指将已获批的药物用于新的适应症,这不仅可以节省时间和资源,还有可能提高药物开发的成功率。目前,DrugBank 中注册了约 2589 种小分子药物,UMLS 数据库记录了超过 25000 种疾病,产生了超过 6000 万对药物 - 疾病组合,但其中只有不到 5% 被确定有明确的治疗关系,这为数据分析方法挖掘药物与疾病之间的潜在关联提供了机会。

随着智能计算方法的发展,机器学习算法被用于构建预测药物、基因和疾病之间关系的模型。这些模型在实验方法生成的数据集上进行训练,然后用于预测关联。评估预测模型的性能从模型的准确性和预测结果与医学或生物学数据库中知识的验证两个角度进行。虽然预测结果可能不完全准确,但可以帮助生物信息学研究人员缩小研究范围,节省时间和成本。

构建预测模型主要有两种方法:基于生物网络建模和应用机器学习技术。机器学习方法具有显著优势,能够利用先进算法优化预测潜力。然而,机器学习方法的有效性很大程度上依赖于训练数据集的质量,通常包括正样本和负样本。正样本通常没有问题,但实验验证的负样本稀缺。目前常用的随机负采样方法无法保证负样本数据集的质量,从而影响分类器的预测性能。

本文提出了一种选择高度可靠负样本的方法,以增强药物、基因和疾病之间关系的预测。主要贡献如下:
- 提

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值