Nature Medicine|TxGNN大模型:精准预测,深度解析,重塑药物研发与医疗未来
在《Nature Medicine》期刊上发表的文章《A foundation model for clinician-centered drug repurposing》中,研究了一种面向临床医生的药物再利用模型。该模型旨在为临床医生提供药物再利用的建议和指导。药物再利用是指将已经批准用于一种疾病治疗的药物重新应用于治疗其他疾病。这种方法可以减少新药开发的时间和成本,提高治疗效果,并为患者提供更多治疗选择。通过使用基于文本分析的技术,该模型能够分析药物描述文本,将药物转化为数值特征,并计算出药物之间的相似度。通过查询相似度矩阵,医生可以获得与给定药物相似的其他药物的建议,从而为临床决策提供支持。这项研究为临床医生提供了一个基础模型,可以进一步改进和优化以满足实际需求。

01.引言
文章介绍了药物再利用人工智能(AI)模型在临床应用中的局限性,并提出了本研究的核心——TxGNN模型。现有的药物再利用AI模型主要关注已有药物对应治疗方案的疾病,因此在临床实际中存在一定限制。然而,为了突破这一局限性,研究团队开发了基于图神经网络(GNN)的TxGNN模型。TxGNN能够识别潜在的治疗候选药物,甚至对于受限使用的疾病,也具备预测能力。这一创新点强调了TxGNN在药物研发和疾病治疗领域的巨大潜力,为药物再利用提供了新的视角和解决方案。因此,TxGNN模型在推动药物再利用领域的发展上具有重要的意义。
02.TxGNN
一、TxGNN模型介绍
TxGNN是一个基于图神经网络(GNN)和度量学习模块的药物重定位模型,专为多疾病、零样本情境下的药物重定位而设计。它能够预测跨17,080种疾病的药物重定位候选,包括那些尚无治疗方法的疾病。
1.模型架构
TxGNN模型主要由两个模块组成:TxGNN Predictor(预测模块)和TxGNN Explainer(解释模块)。
- TxGNN Predictor(预测模块):
-
功能:预测药物的适应症(indications)和禁忌症(contraindications)。
-
架构:该模块基于图神经网络(GNN)构建,优化了医学知识图谱(KG)中的关系。通过大规模、自监督的预训练,GNN为KG中的所有概念生成有意义的表示。然后,通过微调,该预训练模型被适应于处理治疗任务,并预测跨多种疾病的药物候选适应症和禁忌症。
-
度量学习模块:用于零样本预测,利用疾病可以共享疾病相关的遗传和基因组网络这一见解,从可治疗的疾病向无治疗方法的疾病转移知识。
- TxGNN Explainer(解释模块):
-
功能:解析KG,提取并简洁地表示相关医学知识,以生成多跳可解释的路径,这些路径解释了模型预测背后的逻辑。
-
架构:使用名为GraphMask的自我解释性方法,生成一个稀疏但充分的医学概念子图,这些概念被认为是TxGNN预测的关键。它为KG中的每条边生成一个0到1之间的重要性分数,并通过组合药物-疾病子图和边重要性分数,产生多跳可解释的路径,将疾病与预测药物联系起来。
2.各部分功能
-
GNN模型:嵌入药物和疾病到一个潜在的表示空间,该空间被优化以反映KG中概念的几何关系。
-
度量学习模块:实现知识从可治疗疾病向无治疗疾病的转移,支持零样本预测。
-
TxGNN Predictor的预测功能:通过聚合来自相似疾病的嵌入知识,并自适应地基于其与查询疾病的相似性进行聚合,来生成针对查询疾病的药物预测。
-
TxGNN Explainer的解释功能:通过生成多跳可解释的路径,这些路径展示了连接预测药物和预测疾病的医学概念之间的关联,从而解释了TxGNN的预测。
TxGNN模型通过其创新的架构和组成部分,为药物重定位提供了强大的预测和解释能力,尤其是在零样本情境下,为那些药物使用受限的疾病提供了新的治疗候选预测方法。

TxGN模型架构
03.研究结果
一、TxGNN:准确预测药物适应症和禁忌症
1.预测准确性:
1.1适应症预测准确性:
- TxGNN在严格的零样本评估下,较现有方法提高了49.2%的适应症预测准确性。这意味着,对于那些没有现成药物治疗或治疗选择有限的疾病,TxGNN能够更准确地预测潜在的治疗药物。
1.2禁忌症预测准确性:
- 同样在零样本评估下,TxGNN提高了35.1%的禁忌症预测准确性。禁忌症的准确预测对于避免药物不良反应和确保患者安全至关重要。
2.预测范围:
- TxGNN能够预测跨17,080种不同疾病的药物适应症和禁忌症,显示了其广泛的适用性。这包括了许多罕见病和难治性疾病,为这些疾病的治疗提供了新的希望。

研究结果示意图一
二、TxGNN:可解释的开发、可视化和评估
TxGNN模型通过整合一个庞大而全面的生物知识图谱(KG),并利用几何深度学习模型,实现了对疾病-药物对的适应症或禁忌症可能性的准确预测。该模型能够生成可解释的多跳路径,这些路径揭示了预测背后的逻辑,促进了人类对预测如何基于医学知识的理解。
1.数据结果
1.1预测准确性:
-
在内部测试集上,TxGNN模型在预测疾病-药物对的适应症和禁忌症方面表现出色,其准确性优于其他基线方法。
-
在零样本评估下,TxGNN较现有方法提高了显著的预测准确性,其中适应症预测准确性提高了49.2%,禁忌症预测准确性提高了35.1%。
1.2多跳路径的可解释性:
-
TxGNN模型生成的多跳路径不仅解释了预测结果,还提供了丰富的医学知识背景。
-
这些路径涵盖了基因组数据、细胞信号、基因活动水平和临床记录等多个方面,为研究人员和医生提供了深入的理解。
1.3案例研究:
-
在一项案例研究中,研究人员要求TxGNN模型为三种罕见疾病(包括神经发育障碍、结缔组织疾病和一种导致水分失衡的遗传病)寻找治疗药物。
-
这些疾病在训练数据中并未包含,但TxGNN模型仍然成功预测了潜在的治疗药物。
-
更重要的是,模型还提供了这些预测背后的多跳路径解释,这些解释与现有医学知识一致。
2.可视化和评估:
2.1可视化工具:
-
为了更好地理解和评估TxGNN模型的预测结果和多跳路径解释,研究人员开发了相应的可视化工具。
-
这些工具能够将复杂的预测结果和多跳路径以直观的方式呈现出来,便于研究人员和医生进行深入的分析和理解。
2.2评估方法:
-
研究人员采用了多种评估方法来验证TxGNN模型的性能和准确性。
-
这些方法包括内部测试集上的准确性评估、零样本评估下的性能比较以及案例研究中的实际应用效果评估等。
-
通过这些评估方法,研究人员能够全面、客观地了解TxGNN模型的性能和实际应用价值。

研究结果示意图二
04.研究意义
1.推动药物研发与重定位:TxGNN准确预测药物适应症和禁忌症,为药物研发提供强大工具。预测潜在治疗药物可帮助研究人员更快锁定目标化合物,节省时间和成本。同时,发现已有药物的新适应症,促进药物的重新定位和再利用,延长药物生命周期。
2. 提升个性化医疗水平:TxGNN生成多跳可解释路径,揭示药物与疾病复杂关系,为个性化治疗方案提供科学依据。帮助医生准确判断疾病类型和药物反应,制定更有效治疗策略,提升个性化医疗水平。
3.加速医学知识发现:TxGNN整合生物知识图谱,包括基因组数据、细胞信号、基因活动水平和临床记录等。利用这些知识,TxGNN发现新药物作用机制和疾病治疗策略,推动医学知识进步。有助于理解疾病本质、开发新治疗方法、提升患者生活质量。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

TxGNN大模型解析及大模型AI学习路径
2165

被折叠的 条评论
为什么被折叠?



