人工智能咨询培训老师叶梓 转载标明出处
想要掌握如何将大模型的力量发挥到极致吗?叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具(限时免费)。
1小时实战课程,您将学习到如何轻松上手并有效利用 Llama Factory 来微调您的模型,以发挥其最大潜力。
优快云教学平台录播地址:https://edu.youkuaiyun.com/course/detail/39987
更多分享,关注视频号:sphuYAMr0pGTk27 抖音号:44185842659
医学领域的“语义问题”,也称为“沟通问题”,指的是可靠记录医学信息并使其在不同系统间互操作的困难任务。这个问题不仅影响研究人员和软件开发者,而且影响医疗保健提供者(HCPs)日常的医疗信息链接工作,增加了医疗文档的负担,并为自动化医疗任务带来了挑战。一项新的研究提出了一种结合检索增强生成(Retrieval Augmented Generation, RAG)的方法,通过知识图谱来提供结构化推理和真理模型,与LLMs结合使用,以优化医学信息的组织和决策支持。
论文链接:https://www.nature.com/articles/s41746-024-01081-0
方法
尽管大模型在处理语言时表现出色,但它们缺乏一个确定性的“真理模型”,并且它们自我检验准确性的能力有限。而知识图谱则提供了一种结构化的信息表示方式,能够弥补大模型在这方面的不足。
表格1 展示了大模型和知识图谱单独使用时的优势和劣势,以及它们结合使用时的互补性。例如,大模型单独使用时可能会产生幻觉(hallucination),即创造出看似合理但实际上并不存在的事实。而当与知识图谱结合使用时,这种幻觉现象可以被有效控制,因为知识图谱提供了一个可靠的事实基础。
新方法利用大模型的文本处理能力来构建和丰富知识图谱。大模型能够从大量文本数据中提取信息,识别实体和关系,并将这些信息结构化,从而创建或增强知识图谱。例如,可以从医学文献中提取药物相互作用、疾病症状等信息,并将其添加到知识图谱中。
图1 展示了大模型(LLMs)与知识图谱(KGs)结合的几种方式,特别是在检索增强生成中的应用。
图1a: 大模型用于构建知识图谱
大模型被用于从文本查询中自动构建、丰富和完善知识图谱。这些文本查询可以由医疗信息系统生成。大模型通过以下步骤增强知识图谱:
-
文本分析:大模型分析文本数据,识别关键实体和概念。
-
结构化信息提取:从文本中提取结构化信息,如药物名称、症状、疾病等。
-
知识图谱构建:将提取的信息整合到知识图谱中,形成实体和它们之间的关系。
这个过程说明了大模型如何能够自动化地从大量文本中提取信息,并用于构建和更新知识图谱,这对于医学研究和临床决策支持系统非常有价值。
图1b: 检索增强生成(RAG)中的大模型和知识图谱
通过检索增强生成来提升大模型的性能包括两个主要步骤:
-
检索信息:大模型从知识图谱或非结构化的网络知识库中检索相关信息。
-
生成响应:使用检索到的信息来丰富和优化大模型的输出,提高其准确性和可靠性。
在医疗领域,这种方法可以用来提供更准确的诊断建议、治疗方案或回答复杂的医疗查询。
图1c: 大模型和知识图谱的混合使用
在更复杂的应用中,大模型和知识图谱可以并行使用或混合使用,以解决特定的医疗信息推理任务。这可能包括:
-
并行处理:大模型和知识图谱各自独立处理信息,然后比较和整合结果。
-
混合模型:大模型和知识图谱的某些部分可能被集成到一个统一的模型中,以提供更复杂的推理和决策支持。
例如,SapBert是一种结合了在PubMed上训练的语言模型和统一医学语言系统(UMLS)的知识的模型,用于回答医学查询。
尽管结合使用大模型和知识图谱可能会在自动化医疗信息任务时产生重要的不准确性,但这些技术的特性对于提高医生处理信息和做出医疗决策的能力至关重要。这可能包括为质量控制和签字设计界面,以及对解释信息的可靠性程度进行差异化标记,以标记信息何时应手动验证。