本文介绍了NRAG框架,创新性地融合大语言模型与医学知识图谱,专注于门急诊神经外科疾病诊断。该框架通过知识图谱检索补充缺失症状信息,实现可解释的智能诊断,F1分数达0.8150。NRAG采用规划-检索-推理三步走战略,解决了医疗大语言模型在可解释性和预测性能方面的局限性,为临床辅助决策提供了可靠依据,实验表明其性能超越了包括ChatGPT等在内的多种模型。

文章摘要
本文提出NRAG框架,创新性地融合大语言模型与医学知识图谱,专注于门急诊神经外科疾病诊断。该框架通过知识图谱检索补充缺失症状信息,实现可解释的智能诊断,F1分数达0.8150,为临床辅助决策提供可靠依据。
原文pdf:https://t.zsxq.com/5kL64
引言:智能医疗诊断的新突破
精准医疗代表着现代临床研究的发展趋势,是未来智能医疗研究的指引方向。疾病的精准诊断是精准医疗的关键组成部分,也是人工智能与临床实践结合的核心任务。
在门急诊场景下,医生需要在短时间内仅凭患者的部分表型信息做出诊断决策。这种时间紧迫、数据碎片化、合并症复杂的临床环境,给传统的基于自由文本的建模方法带来了巨大挑战。
当前诊断模型面临的挑战
疾病诊断模型的发展经历了三个阶段:
- 机器学习阶段:以随机森林为基础的DeepPatient、支持向量机模型、逻辑回归模型eNRBM等为代表,但这些方法通常局限于处理简单的诊断任务。
- 深度学习阶段:LSTM模型用于重症监护患者的诊断分类,双曲空间和共现图卷积神经网络实现ICD自动编码,自注意力BERT模型结合自然语言处理技术实现疾病诊断。尽管这些方法表现优异,但仍存在明显不足——它们往往依赖更大的数据集和大量的计算资源。
- 大语言模型时代:随着ChatGPT等大型语言模型的出现,通过在大规模语料库上进行预训练,再用特定领域数据进行微调,使模型能够在各种下游任务中表现出色。
研究动机:解决临床诊断的两大核心问题
本研究针对现有医疗大语言模型在辅助诊断中的局限性,特别是在可解释性和预测性能方面,提出了两个关键研究问题:
Q1: 信息不完整问题
临床记录往往记录的症状少于患者实际表现的症状。例如,虽然神经外科医生会例行询问高血压等常见合并症,但这类表型信息经常从医疗记录中被省略。这就提出了一个关键挑战:如何在信息稀缺的情况下做出准确预测?
Q2: 可解释性需求
鉴于医疗诊断的高度专业性,模型迫切需要为其预测提供基于证据的理论依据。换句话说,这需要提高复杂场景下的推理能力,并增强大语言模型输出的可解释性。此外,当前的医疗大语言模型主要针对一般临床应用场景,未能解决门急诊场景特有的文档记录不足和时间关键决策要求。

NRAG框架:知识图谱增强的智能诊断系统
为了解决这些限制,本研究利用知识图谱来增强大语言模型的可靠性和可解释性,提出了神经外科知识图谱检索增强框架(NRAG)——一个基于知识图谱引导推理的门急诊可解释疾病诊断框架。
核心创新点
1. LLM-KG融合框架
这是首次将ChatGLM3应用于神经外科疾病智能诊断任务,通过问答形式整合医学知识图谱和大语言模型,实现可解释的诊断推理。为了解决患者表征信息缺失的问题,NRAG结合医学知识图谱的可靠知识来丰富患者表征信息。
2. 神经外科问答数据集
为了缓解高质量医疗指令微调数据集的稀缺性,本研究构建了专门为神经外科疾病诊断设计的新型问答数据集。与传统问答数据集不同,它包含强调可解释性的注释,使其更适合医学知识推理和临床决策场景。
3. 卓越的实验性能
实证评估表明,NRAG在门诊部数据集上取得了优异性能(F1分数=0.8112),超越了通用开源大语言模型(如ChatGPT、DeepSeek)和专业医疗大语言模型。专家评估和案例分析进一步证实,NRAG的诊断建议为神经外科实践提供了有临床意义的指导。
NRAG技术架构:三步走战略
NRAG框架通过规划-检索-推理流程运作,主要分为三个步骤:
第一步:关键信息识别
利用信息提取和实体链接技术,从输入数据中快速识别患者的症状表现。该阶段从电子病历(EMR)数据中提取关键信息并进行标准化处理。
技术细节:
- 对所有文本内容进行严格筛查,移除任何可识别的个人信息
- 通过预处理步骤构建高质量结构化数据集
- 整个工作流程遵守伦理指南(伦理批准号:KY2023-226-02)
第二步:知识检索与论证
采用开源医学知识图谱,根据患者信息检索相关领域知识。检索到的知识被组织成潜在的疾病相关关联路径,随后反馈到系统中。
核心机制:
- 以患者症状信息为源头,检索知识图谱的可靠知识
- 特别关注"症状-疾病"多跳路径
- 将检索到的核心路径作为输入的一部分,丰富模型的提示信息
这种方式使NRAG不仅能从知识图谱中检索可靠知识进行知识增强,还能优化大语言模型推理的准确性和依据。
第三步:诊断预测
使用在神经外科问答数据集上微调的大语言模型进行疾病预测,同时为推理过程提供可解释的知识图谱路径。该框架实现了结构化医学知识与神经推理能力的系统整合,确保诊断的准确性和可解释性。
数据资源:构建神经外科专用数据集
数据收集与预处理
本研究构建了一个包含3亿条神经外科门诊记录的高质量结构化数据集。数据收集过程严格遵守医疗数据隐私保护规定:
- 系统性移除所有可识别的个人信息
- 严格的文本内容筛查
- 完整的伦理审查流程
- 为后续研究和数据分析奠定坚实基础
问答数据集的特色
与传统医疗问答数据集相比,本研究构建的神经外科问答数据集具有以下特点:
-
专业性
:专门针对神经外科疾病诊断场景设计
-
可解释性
:包含强调推理过程的注释
-
实用性
:更适合医学知识推理和临床决策
-
高质量
:经过专业医生审核和标注
医学大语言模型的发展与应用
国际前沿进展
在医学领域,众多研究已经验证了医学大语言模型的实用性,并展示了使用生物医学数据进行微调的有效性:
Med-PaLM2:由Google和DeepMind研究人员联合开发,不仅通过了美国医学执照考试(USMLE),还在MultiMedQA基准测试中达到了与执业临床医生相当的性能。
BioMedLM(PubMedGPT):由斯坦福大学基础模型研究中心(CRFM)和MosaicML创建,代表了另一个里程碑。
中文医学大模型
在中文领域,显著进展包括MedGPT、百川(Baichuan)和TCMLLM-PR等模型。此外,有研究者提出了基于指令微调技术的专门疾病诊断任务,也取得了良好的性能,但未结合知识图谱。
提示工程的探索
在大语言模型提示设计的探索中,医学专用大语言模型如MedGPT和华佗(HuaTuo)表明,为大语言模型设置专业角色并补充辅助信息可以显著提高准确性。
幻觉问题与知识图谱解决方案
大语言模型的幻觉挑战
研究者注意到,大语言模型存在幻觉问题,容易产生错误推理并导致不正确的答案。这在医疗诊断等高风险场景中尤为危险。
知识图谱的优势
针对这一问题,一些学者提出了基于知识图谱的规划检索推理框架:
-
以知识集为基础
:使用结构化的医学知识作为推理依据
-
检索可靠推理路径
:从知识图谱中提取经过验证的知识关联
-
引导推理方向
:为模型提供可信的推理轨迹
知识图谱的核心优势在于其图形化的知识表示,能够更清晰地表达知识的结构和关系,使算法更容易理解和使用。
NRAG的独特价值:补充缺失信息与提供诊断依据
解决信息不完整问题
NRAG通过以下机制解决临床记录中的信息缺失问题:
-
症状补充
:从知识图谱中检索可能缺失但与疾病相关的症状信息
-
知识增强
:利用"症状-疾病"关联路径丰富患者表征
-
个性化检索
:根据每个患者的具体情况进行定制化知识检索
提升可解释性
NRAG为诊断结果提供基于知识路径的证据:
-
透明的推理过程
:展示从症状到疾病诊断的完整知识路径
-
可验证的依据
:所有推理步骤都基于医学知识图谱的可靠知识
-
专家可理解
:提供符合临床思维逻辑的诊断解释
实验结果:全面超越现有模型
定量评估结果
NRAG在实验中取得了令人瞩目的性能表现:
核心指标:
-
F1分数达到0.8150
:显著提升诊断准确性
-
门诊数据集F1分数0.8112
:优于所有对比模型
对比实验
通用领域大语言模型对比:
- 超越ChatGPT、DeepSeek等主流通用模型
- 在医学专业场景中展现更强的适应性
医学领域大语言模型对比:
- 性能优于现有医学专用大语言模型
- 在可解释性方面具有明显优势

专家评估
临床专家评估进一步确认:
- NRAG的诊断建议为神经外科实践提供有临床意义的指导
- 推理过程符合临床思维逻辑
- 可解释性得到显著提升
消融实验
消融研究证实了各个组件的重要性:
- 知识图谱整合显著改善诊断准确性
- 问答形式的训练增强了模型的推理能力
- 多跳路径检索对补充缺失信息至关重要

临床应用价值:门急诊场景的智能助手
门急诊场景的特殊需求
门急诊场景具有以下特点:
-
时间紧迫
:需要快速做出诊断决策
-
信息碎片化
:患者信息往往不完整
-
复杂合并症
:需要综合考虑多种症状和疾病
NRAG的适配优势
NRAG专门针对门急诊场景设计:
-
快速诊断
:通过知识图谱快速检索相关医学知识
-
信息补全
:自动补充可能缺失的症状信息
-
辅助决策
:提供可解释的诊断建议和依据
实际应用场景
神经外科门诊:
- 辅助医生快速筛查常见神经外科疾病
- 提醒可能被忽略的重要症状
- 提供诊断依据供医生参考
急诊场景:
- 在时间紧迫情况下提供快速诊断建议
- 帮助识别危急重症
- 支持多学科协作诊疗
技术创新:ChatGLM3的首次医学应用
模型选择的创新性
本研究首次将ChatGLM3应用于神经外科疾病智能诊断任务,这是一个重要的技术突破。
ChatGLM3的优势
-
强大的中文理解能力
:更适合处理中文医疗记录
-
良好的指令跟随能力
:能够准确理解诊断任务需求
-
高效的推理性能
:在保证准确性的同时提供快速响应
与知识图谱的深度融合
NRAG创新性地实现了ChatGLM3与医学知识图谱的无缝整合:
- 通过问答形式建立有效的交互机制
- 利用知识图谱增强模型的医学知识基础
- 实现可解释的端到端诊断流程
方法论贡献:深度临床数据挖掘与医学知识库整合
理论框架
NRAG不仅是一个技术工具,更为深度临床数据挖掘与医学知识库资源整合提供了方法论框架:
数据驱动与知识驱动的结合:
-
从大量临床数据中学习疾病诊断模式
-
利用结构化医学知识图谱提供可靠的知识基础
-
将数据洞察与专家知识有机融合,实现优势互补
可扩展的整合范式:
- 提供标准化的知识图谱接入接口
- 支持多源异构医学知识库的动态整合
- 建立可复用的临床数据挖掘流程
跨领域应用潜力
该方法论框架具有广泛的推广价值:
-
-
其他医学专科
- 可扩展至心内科、呼吸科等其他专科疾病诊断
-
-
多模态数据融合
- 支持整合影像、实验室检查等多维度数据
-
-
知识更新机制
- 建立动态知识图谱更新流程,保持诊断系统的时效性
临床决策支持系统构建
NRAG为构建新一代临床决策支持系统(CDSS)提供了技术路线:
-
-
智能化
- 利用大语言模型的推理能力
-
-
可信化
- 基于知识图谱的可靠医学知识
-
-
实用化
- 针对真实临床场景优化设计
详细方法论:NRAG的技术实现
知识图谱构建
数据来源:
本研究采用开源医学知识图谱作为基础,并结合神经外科专业知识进行扩展和优化。
图谱结构:
-
-
实体类型
- 疾病、症状、检查、治疗等
-
-
关系类型
- 症状-疾病、疾病-检查、疾病-治疗等
-
-
属性信息
- 发病率、严重程度、时间特征等
质量控制:
- 由资深神经外科专家审核知识图谱内容
- 定期更新以反映最新医学进展
- 建立知识溯源机制,确保每条知识的来源可追溯
信息提取与实体链接
命名实体识别(NER):
采用基于深度学习的NER模型,从电子病历文本中识别医学实体:
code
输入文本 → 分词 → 实体识别 → 实体分类 → 标准化
实体链接策略:
-
-
精确匹配
- 优先使用标准医学术语词典进行精确匹配
-
-
模糊匹配
- 对于口语化表达,使用语义相似度计算
-
-
上下文消歧
- 利用临床上下文信息解决歧义
技术细节:
- 采用BERT类模型进行实体表示学习
- 使用余弦相似度计算实体与知识图谱节点的匹配度
- 设置置信度阈值,过滤低质量匹配结果
知识检索算法
多跳路径搜索:
NRAG采用改进的广度优先搜索(BFS)算法,在知识图谱中检索相关路径:
算法流程:
- 以患者症状实体作为起始节点
- 向外扩展,搜索连接到疾病节点的路径
- 限制最大跳数(通常设置为2-3跳)
- 根据路径评分筛选最相关的路径
路径评分机制:
路径得分综合考虑多个因素:
-
-
关联强度
- 边的权重,反映症状与疾病的关联程度
-
-
路径长度
- 较短路径通常表示更直接的关联
-
-
节点重要性
- 考虑节点在图谱中的中心性
-
-
临床频率
- 基于历史诊断数据的统计频率
优化策略:
- 使用图嵌入技术预计算节点表示,加速检索
- 实施路径剪枝,避免检索不相关的长路径
- 缓存常见症状组合的检索结果
提示工程与模型微调
提示模板设计:
NRAG精心设计了结构化的提示模板,包含以下关键要素:
code
【角色设定】你是一位经验丰富的神经外科医生...
【患者信息】
- 主诉症状:[症状列表]
- 病史信息:[相关病史]
【知识参考】
根据医学知识图谱,以下信息可能相关:
[检索到的知识路径]
【诊断任务】
请基于以上信息:
1. 分析可能的疾病诊断
2
. 解释诊断依据
3
. 说明推理过程
微调数据构建:
基于3亿条门诊记录,构建高质量问答对:
-
-
数据筛选
- 选择记录完整、诊断明确的病例
-
-
问题生成
- 将患者症状转化为诊断问题
-
-
答案标注
- 包含诊断结果、推理过程和知识依据
-
-
专家审核
- 由神经外科医生验证数据质量
微调策略:
- 采用LoRA(Low-Rank Adaptation)技术,高效微调大模型
- 使用混合精度训练,提高训练效率
- 实施课程学习,从简单到复杂逐步训练
- 设置早停机制,防止过拟合
推理与生成
两阶段推理流程:
第一阶段 - 知识整合:
- 将检索到的知识路径转换为自然语言描述
- 与患者症状信息整合,形成完整的输入上下文
- 识别关键诊断线索和潜在风险因素
第二阶段 - 诊断生成:
- ChatGLM3基于整合后的信息进行推理
- 生成结构化的诊断建议
- 输出包含诊断结果、置信度、推理依据和建议检查
输出格式控制:
通过精心设计的解码策略,确保输出格式规范:
- 使用约束解码,强制输出符合预定义结构
- 设置温度参数,平衡创造性和准确性
- 实施后处理,标准化医学术语
总结:开启智能医疗诊断新纪元
NRAG框架代表了人工智能辅助医疗诊断领域的重大突破,成功解决了传统诊断系统长期面临的核心挑战。通过创新性地融合大语言模型与医学知识图谱,NRAG在门急诊神经外科这一时间敏感、信息碎片化的复杂场景中,实现了准确性、可解释性与实用性的完美平衡 。
核心成果与突破
卓越的诊断性能:NRAG在3亿条门诊记录的大规模数据集上取得了F1分数0.8150的优异表现,全面超越了包括ChatGPT-4、MedGPT等在内的通用和医学专用大语言模型 。这一成果不仅验证了知识图谱增强策略的有效性,更证明了LLM-KG融合范式在医疗领域的巨大潜力。
解决信息不完整难题:针对临床记录中症状信息经常缺失的普遍问题,NRAG通过知识图谱的多跳路径检索机制,智能补充潜在的相关症状信息,使模型即使在信息稀缺的情况下也能做出准确诊断 。这一创新显著提升了系统在真实临床场景中的实用价值。
实现可解释的智能推理:不同于传统"黑箱"式诊断系统,NRAG为每个诊断结果提供基于知识图谱路径的明确证据链,使医生能够清晰理解模型的推理过程 。这种透明性不仅增强了临床医生对系统的信任,也为医疗AI的安全应用提供了重要保障 。
方法论贡献与应用前景
构建可扩展的整合范式:NRAG不仅是一个技术工具,更为深度临床数据挖掘与医学知识库资源整合提供了系统性的方法论框架 。这一范式具有良好的可扩展性,可推广至心内科、呼吸科等其他专科,支持多模态医学数据融合,并建立动态知识更新机制。
推动临床决策支持系统发展:作为新一代临床决策支持系统(CDSS)的技术基础,NRAG将大语言模型的智能推理能力、知识图谱的可靠医学知识以及针对真实临床场景的优化设计有机结合,为构建实用化、可信化的智能医疗系统指明了方向 。
首创ChatGLM3医学应用:本研究首次将ChatGLM3应用于神经外科疾病诊断任务,通过精心设计的问答形式和指令微调策略,成功实现了通用大语言模型向专业医疗诊断工具的转化 。这一探索为中文医疗AI的发展提供了宝贵经验。
临床价值与社会意义
NRAG框架的提出恰逢其时,为应对门急诊场景中时间紧迫、数据碎片化、合并症复杂等挑战提供了切实可行的解决方案。系统不仅能够辅助医生快速筛查疾病、提醒可能被忽略的重要症状,还能在危急情况下提供可靠的诊断参考,真正实现了精准医疗理念在临床一线的落地应用 。
未来展望
随着医学知识图谱的持续更新和大语言模型技术的不断进步,NRAG框架具有巨大的发展潜力。未来研究可以进一步探索多模态数据(如医学影像、实验室检查结果)的整合,建立跨专科的通用诊断平台,并通过持续学习机制保持系统的时效性 。NRAG的成功实践证明,通过合理设计的技术框架,人工智能完全有能力成为医生的可靠助手,共同守护人类健康。
如何学习AI大模型 ?
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓
优快云粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传优快云,朋友们如果需要可以扫描下方二维码&点击下方优快云官方认证链接免费领取 【保证100%免费】

读者福利: 👉👉优快云大礼包:《最新AI大模型学习资源包》免费分享 👈👈
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
👉1.大模型入门学习思维导图👈
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)

👉2.AGI大模型配套视频👈
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。


👉3.大模型实际应用报告合集👈
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

👉4.大模型实战项目&项目源码👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战项目来学习。(全套教程文末领取哈)

👉5.大模型经典学习电子书👈
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)

👉6.大模型面试题&答案👈
截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)

为什么分享这些资料?
只要你是真心想学AI大模型,我这份资料就可以无偿分享给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!
这些资料真的有用吗?
这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


优快云粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传优快云,朋友们如果需要可以扫描下方二维码&点击下方优快云官方认证链接免费领取 【保证100%免费】

读者福利: 👉👉优快云大礼包:《最新AI大模型学习资源包》免费分享 👈👈
7526

被折叠的 条评论
为什么被折叠?



