本篇推文引自:A graph auto-encoder model for miRNA-disease associations prediction
1. 摘要
越来越多的证据表明miRNAs的异常表达参与了人类各种复杂疾病的进化和进展。将疾病相关的miRNAs作为新的生物标志物,可以促进疾病病理学和临床医学的发展。我们提出了一种新的图自动编码模型GAEMDA,用于端到端地识别miRNA疾病的潜在关联。具体地说,GAEMDA模型应用了基于图神经网络的编码器,它包含聚合函数和多层感知器,用于聚集节点的邻域信息,生成miRNA和疾病节点的低维嵌入,实现异构信息的有效融合。然后,将miRNA和疾病节点的嵌入输入双线性解码器,以识别miRNA与疾病节点之间的潜在联系。实验结果表明,在5倍交叉验证下,GAEMDA的曲线下面积平均为93.56±0.44%。此外,我们还对结肠肿瘤、食管肿瘤和肾脏肿瘤进行了病例研究。因此,在与这些疾病相关的前50个miRNAs预测中,有48个被人类癌症中差异表达的miRNAs和人类疾病数据库中的microRNA解除调控数据库所证实,令人满意的预测性能表明GAEMDA模型可以作为一个可靠的工具来指导miRNAs的调控作用的后续研究。此外,源代码可在https://github.com/chimianbuhetang/GAEMDA上找到。
2. 介绍
MicroRNAs是一种小的、内源性的、非编码的单链RNA分子,其长度约为22个核苷酸。越来越多的研究分析表明,miRNAs在细胞增殖、分化、信号转导、病毒感染等多种复杂生物学过程中发挥着关键作用。
计算方法可以为研究排名靠前的miRNAs提供一个新的视角,并促使他们进行相关的实验方法来进一步验证这些关联。在过去的十年中,已经提出了许多预测miRNA疾病关联的计算方法。在这些方法中,基于相似性度量的方法是一种经典的计算方法,它基于功能相似的mirna倾向于与表型相似的疾病相关的假设,对疾病相关的mirna进行排序。基于机器学习的方法是另一种常用的预测miRNA疾病相关性的计算方法。
受图神经网络在图结构数据数据集的巨大进展的影响,许多基于图神经网络的方法正在出现,以解决潜在的miRNA疾病关联的预测问题。在本文中,我们提出了一个新的图自动编码模型GAEMDA,用于预测miRNA疾病的潜在关联。具体来说,我们首先构造了miRNA和疾病二部图来描述miRNA与疾病之间的关联,其中每个节点用相应的相似性信息表示,每个连接代表相应的关联。其次,考虑到miRNA和疾病节点的异质性,设计了节点类型转换矩阵,将miRNA和疾病节点投影到同一向量空间中。第三,为了充分挖掘miRNA与疾病之间丰富的相互作用信息,我们通过基于图神经网络的编码器,将节点的异构邻域特征聚合到原始特征中,生成节点的嵌入。第四,将miRNA和疾病节点嵌入到双线性译码器中,重建miRNA节点与疾病节点之间的链接。然后利用交叉熵损失和反向传播算法对整个模型进行端到端的训练。此外,我们利用5倍交叉验证对GAEMDA模型的预测性能进行了评估。最后,GAEMDA的平均曲线下面积(AUC)为93.56±0.44%,准确度为84.9

最低0.47元/天 解锁文章
1694

被折叠的 条评论
为什么被折叠?



