@@
Abstract
多药副作用预测问题考虑了单独服用两种药物不会导致特定副作用的情况; 但是,当两种药物联合使用时,会出现副作用。在这项工作中,我们证明了多关系知识图谱完成在多药副作用预测问题上达到了最新的结果。实验结果表明,当药物的蛋白质靶标被很好地表征时,我们的方法特别有效。与以前的工作相比,我们的方法为湿实验室验证提供了更多可解释的预测和假设。
1 Introduction
疾病和其他与健康相关的问题通常可以通过药物治疗。 但是,在许多情况下,可以给予多种药物来治疗单一疾病或解决合并症。 然而,由于未知的药物相互作用,这样的组合显着增加了意外副作用的风险。
在这项工作中,我们表明,多关系知识图谱(KG)的完成在预测这些未知的药物相互作用中提供了最新的性能。KG在包含不同类型的边的意义上是多关系的。我们将问题表述为KG中的多关系链接预测问题,并采用现有的图嵌入策略来预测相互作用。与现有的解决多药副作用问题的方法相反,我们采用了可解释的功能; 因此,我们的方法自然会产生可解释的预测,并提出用于湿实验室验证的假设。此外,虽然我们专注于副作用预测问题,但是我们的方法是通用的,可以应用于任何多关系链接预测问题。
最近的许多工作都考虑了预测药物相互作用的问题(例如[2,13]和[9]的概率方法)。但是,这些方法仅考虑是否发生相互作用。 他们没有像我们在这里那样考虑相互作用的类型。因此,这些方法不能直接比较。 最近提出的Decagon[14]方法与我们的方法最相似; 他们还可以预测药物相互作用的类型。但是,它们使用图卷积网络和张量分解的复杂组合。相反,我们将神经KG嵌入方法与吸收基于规则的特征的方法结合使用。因此,我们的方法明确地捕获了有意义的关系特征。 根据经验,我们在第4节中证明了我们的方法优于Decagon。
2 Datasets
我们使用[14]中使用的数据集的公开可用的预处理版本。它由具有两个主要成分的多关系知识图谱组成:蛋白质-蛋白质和药物-药物相互作用网络。已知的药物-蛋白质靶标关系将这些不同的成分联系起来。蛋白质-蛋白质之间的相互作用来自几种现有的来源。 它被过滤为仅包含经过实验验证的人类之间的身体的相互作用。药物相互作用是从TWOSIDES数据库中提取的[11]。药物-蛋白质靶标关系是来自STITCH [10]数据库的经过实验验证的相互作用。最后,使用SIDER [6]和OFFSIDES [11]数据库来鉴定每种药物的单药副作用。请参见Table 1,详细了解图各部分的大小和密度。 有关更多详细信息,请参见[14]。每个药物-药物链接对应于特定的多药副作用。 我们的目标是预测缺少的药物链接。

3 Methods
KG嵌入方法学习KG的实体和关系类型的矢量表示[1]。我们研究DistMult [12]的性能,DistMult是一种常用的KG嵌入方法,由于药物-药物(多药副作用)关系类型的对称性质,其对称性假设非常适合此问题。KG嵌入方法的优点是它们的效率和学习适合下游任务的细粒度实体类型的能力,而无需手工制定规则。但是,这些嵌入方法比基于规则的方法难于解释,并且不能吸收区域知识。
关系特征是在KG中评估以确定其真实值的逻辑规则。例如,公式( drug 1 \operatorname{drug}_{1} drug1,hasTarget, protein 1 \operatorname{protein}_{1} protein1)∧( drug 2 \operatorname{drug}_{2} drug2,hasTarget, protein 2 \operatorname{protein}_{2} protein2)对应于二元特征,如果 drug 1 \operatorname{drug}_{1}

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



