生物信息学|miRNA-疾病关联预测的图形自动编码模型

本篇推文引自:A graph auto-encoder model for miRNA-disease associations prediction

1. 摘要

    越来越多的证据表明miRNAs的异常表达参与了人类各种复杂疾病的进化和进展。将疾病相关的miRNAs作为新的生物标志物,可以促进疾病病理学和临床医学的发展。我们提出了一种新的图自动编码模型GAEMDA,用于端到端地识别miRNA疾病的潜在关联。具体地说,GAEMDA模型应用了基于图神经网络的编码器,它包含聚合函数和多层感知器,用于聚集节点的邻域信息,生成miRNA和疾病节点的低维嵌入,实现异构信息的有效融合。然后,将miRNA和疾病节点的嵌入输入双线性解码器,以识别miRNA与疾病节点之间的潜在联系。实验结果表明,在5倍交叉验证下,GAEMDA的曲线下面积平均为93.56±0.44%。此外,我们还对结肠肿瘤、食管肿瘤和肾脏肿瘤进行了病例研究。因此,在与这些疾病相关的前50个miRNAs预测中,有48个被人类癌症中差异表达的miRNAs和人类疾病数据库中的microRNA解除调控数据库所证实,令人满意的预测性能表明GAEMDA模型可以作为一个可靠的工具来指导miRNAs的调控作用的后续研究。此外,源代码可在https://github.com/chimianbuhetang/GAEMDA上找到。

2. 介绍

    MicroRNAs是一种小的、内源性的、非编码的单链RNA分子,其长度约为22个核苷酸。越来越多的研究分析表明,miRNAs在细胞增殖、分化、信号转导、病毒感染等多种复杂生物学过程中发挥着关键作用。

    计算方法可以为研究排名靠前的miRNAs提供一个新的视角,并促使他们进行相关的实验方法来进一步验证这些关联。在过去的十年中,已经提出了许多预测miRNA疾病关联的计算方法。在这些方法中,基于相似性度量的方法是一种经典的计算方法,它基于功能相似的mirna倾向于与表型相似的疾病相关的假设,对疾病相关的mirna进行排序。基于机器学习的方法是另一种常用的预测miRNA疾病相关性的计算方法。

    受图神经网络在图结构数据数据集的巨大进展的影响,许多基于图神经网络的方法正在出现,以解决潜在的miRNA疾病关联的预测问题。在本文中,我们提出了一个新的图自动编码模型GAEMDA,用于预测miRNA疾病的潜在关联。具体来说,我们首先构造了miRNA和疾病二部图来描述miRNA与疾病之间的关联,其中每个节点用相应的相似性信息表示,每个连接代表相应的关联。其次,考虑到miRNA和疾病节点的异质性,设计了节点类型转换矩阵,将miRNA和疾病节点投影到同一向量空间中。第三,为了充分挖掘miRNA与疾病之间丰富的相互作用信息,我们通过基于图神经网络的编码器,将节点的异构邻域特征聚合到原始特征中,生成节点的嵌入。第四,将miRNA和疾病节点嵌入到双线性译码器中,重建miRNA节点与疾病节点之间的链接。然后利用交叉熵损失和反向传播算法对整个模型进行端到端的训练。此外,我们利用5倍交叉验证对GAEMDA模型的预测性能进行了评估。最后,GAEMDA的平均曲线下面积(AUC)为93.56±0.44%,准确度为84.9

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值