又一Foundation Model发表Nature Medicine！大模型为临床医生赋能药物再利用

TxGNN大模型解析及大模型AI学习路径

最新推荐文章于 2025-11-25 12:11:01 发布

原创最新推荐文章于 2025-11-25 12:11:01 发布 · 1.4k 阅读

24 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #机器学习 #langchain #数据库 #.net #microsoft

Nature Medicine|TxGNN大模型：精准预测，深度解析，重塑药物研发与医疗未来

在《Nature Medicine》期刊上发表的文章《A foundation model for clinician-centered drug repurposing》中，研究了一种面向临床医生的药物再利用模型。该模型旨在为临床医生提供药物再利用的建议和指导。药物再利用是指将已经批准用于一种疾病治疗的药物重新应用于治疗其他疾病。这种方法可以减少新药开发的时间和成本，提高治疗效果，并为患者提供更多治疗选择。通过使用基于文本分析的技术，该模型能够分析药物描述文本，将药物转化为数值特征，并计算出药物之间的相似度。通过查询相似度矩阵，医生可以获得与给定药物相似的其他药物的建议，从而为临床决策提供支持。这项研究为临床医生提供了一个基础模型，可以进一步改进和优化以满足实际需求。

01.引言

文章介绍了药物再利用人工智能（AI）模型在临床应用中的局限性，并提出了本研究的核心——TxGNN模型。现有的药物再利用AI模型主要关注已有药物对应治疗方案的疾病，因此在临床实际中存在一定限制。然而，为了突破这一局限性，研究团队开发了基于图神经网络（GNN）的TxGNN模型。TxGNN能够识别潜在的治疗候选药物，甚至对于受限使用的疾病，也具备预测能力。这一创新点强调了TxGNN在药物研发和疾病治疗领域的巨大潜力，为药物再利用提供了新的视角和解决方案。因此，TxGNN模型在推动药物再利用领域的发展上具有重要的意义。

02.TxGNN

一、TxGNN模型介绍

TxGNN是一个基于图神经网络（GNN）和度量学习模块的药物重定位模型，专为多疾病、零样本情境下的药物重定位而设计。它能够预测跨17,080种疾病的药物重定位候选，包括那些尚无治疗方法的疾病。

1.模型架构

TxGNN模型主要由两个模块组成：TxGNN Predictor（预测模块）和TxGNN Explainer（解释模块）。

TxGNN Predictor（预测模块）：

功能：预测药物的适应症（indications）和禁忌症（contraindications）。
架构：该模块基于图神经网络（GNN）构建，优化了医学知识图谱（KG）中的关系。通过大规模、自监督的预训练，GNN为KG中的所有概念生成有意义的表示。然后，通过微调，该预训练模型被适应于处理治疗任务，并预测跨多种疾病的药物候选适应症和禁忌症。
度量学习模块：用于零样本预测，利用疾病可以共享疾病相关的遗传和基因组网络这一见解，从可治疗的疾病向无治疗方法的疾病转移知识。

TxGNN Explainer（解释模块）：

功能：解析KG，提取并简洁地表示相关医学知识，以生成多跳可解释的路径，这些路径解释了模型预测背后的逻辑。
架构：使用名为GraphMask的自我解释性方法，生成一个稀疏但充分的医学概念子图，这些概念被认为是TxGNN预测的关键。它为KG中的每条边生成一个0到1之间的重要性分数，并通过组合药物-疾病子图和边重要性分数，产生多跳可解释的路径，将疾病与预测药物联系起来。

2.各部分功能

GNN模型：嵌入药物和疾病到一个潜在的表示空间，该空间被优化以反映KG中概念的几何关系。
度量学习模块：实现知识从可治疗疾病向无治疗疾病的转移，支持零样本预测。
TxGNN Predictor的预测功能：通过聚合来自相似疾病的嵌入知识，并自适应地基于其与查询疾病的相似性进行聚合，来生成针对查询疾病的药物预测。
TxGNN Explainer的解释功能：通过生成多跳可解释的路径，这些路径展示了连接预测药物和预测疾病的医学概念之间的关联，从而解释了TxGNN的预测。

TxGNN模型通过其创新的架构和组成部分，为药物重定位提供了强大的预测和解释能力，尤其是在零样本情境下，为那些药物使用受限的疾病提供了新的治疗候选预测方法。

TxGN模型架构

03.研究结果

一、TxGNN：准确预测药物适应症和禁忌症

1.预测准确性：

1.1适应症预测准确性：

TxGNN在严格的零样本评估下，较现有方法提高了49.2%的适应症预测准确性。这意味着，对于那些没有现成药物治疗或治疗选择有限的疾病，TxGNN能够更准确地预测潜在的治疗药物。

1.2禁忌症预测准确性：

同样在零样本评估下，TxGNN提高了35.1%的禁忌症预测准确性。禁忌症的准确预测对于避免药物不良反应和确保患者安全至关重要。

2.预测范围：

TxGNN能够预测跨17,080种不同疾病的药物适应症和禁忌症，显示了其广泛的适用性。这包括了许多罕见病和难治性疾病，为这些疾病的治疗提供了新的希望。

研究结果示意图一

二、TxGNN：可解释的开发、可视化和评估

TxGNN模型通过整合一个庞大而全面的生物知识图谱（KG），并利用几何深度学习模型，实现了对疾病-药物对的适应症或禁忌症可能性的准确预测。该模型能够生成可解释的多跳路径，这些路径揭示了预测背后的逻辑，促进了人类对预测如何基于医学知识的理解。

1.数据结果

1.1预测准确性：

在内部测试集上，TxGNN模型在预测疾病-药物对的适应症和禁忌症方面表现出色，其准确性优于其他基线方法。
在零样本评估下，TxGNN较现有方法提高了显著的预测准确性，其中适应症预测准确性提高了49.2%，禁忌症预测准确性提高了35.1%。

1.2多跳路径的可解释性：

TxGNN模型生成的多跳路径不仅解释了预测结果，还提供了丰富的医学知识背景。
这些路径涵盖了基因组数据、细胞信号、基因活动水平和临床记录等多个方面，为研究人员和医生提供了深入的理解。

1.3案例研究：

在一项案例研究中，研究人员要求TxGNN模型为三种罕见疾病（包括神经发育障碍、结缔组织疾病和一种导致水分失衡的遗传病）寻找治疗药物。
这些疾病在训练数据中并未包含，但TxGNN模型仍然成功预测了潜在的治疗药物。
更重要的是，模型还提供了这些预测背后的多跳路径解释，这些解释与现有医学知识一致。

2.可视化和评估:

2.1可视化工具：

为了更好地理解和评估TxGNN模型的预测结果和多跳路径解释，研究人员开发了相应的可视化工具。
这些工具能够将复杂的预测结果和多跳路径以直观的方式呈现出来，便于研究人员和医生进行深入的分析和理解。

2.2评估方法：

研究人员采用了多种评估方法来验证TxGNN模型的性能和准确性。
这些方法包括内部测试集上的准确性评估、零样本评估下的性能比较以及案例研究中的实际应用效果评估等。
通过这些评估方法，研究人员能够全面、客观地了解TxGNN模型的性能和实际应用价值。

研究结果示意图二

04.研究意义

1.推动药物研发与重定位：TxGNN准确预测药物适应症和禁忌症，为药物研发提供强大工具。预测潜在治疗药物可帮助研究人员更快锁定目标化合物，节省时间和成本。同时，发现已有药物的新适应症，促进药物的重新定位和再利用，延长药物生命周期。

2. 提升个性化医疗水平：TxGNN生成多跳可解释路径，揭示药物与疾病复杂关系，为个性化治疗方案提供科学依据。帮助医生准确判断疾病类型和药物反应，制定更有效治疗策略，提升个性化医疗水平。

3.加速医学知识发现：TxGNN整合生物知识图谱，包括基因组数据、细胞信号、基因活动水平和临床记录等。利用这些知识，TxGNN发现新药物作用机制和疾病治疗策略，推动医学知识进步。有助于理解疾病本质、开发新治疗方法、提升患者生活质量。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述