
一、文章主要内容
文章针对在线医疗平台中消费者健康问题(CHQs)存在冗余信息多、专业术语少,导致医生诊断效率低的问题,聚焦医疗问题摘要(MQS)任务展开研究。该任务旨在将CHQs转化为简洁的医生常用问题(FAQs),但现有方法存在问题焦点识别差、模型幻觉等挑战。
文章首先分析了现有MQS方法的局限性,包括基于序列到序列(Seq2Seq)、强化学习和对比学习的方法在处理医疗领域复杂语义和专业知识上的不足,以及大型语言模型(LLMs)直接微调时存在的焦点识别偏差和生成内容不可靠的问题。
随后提出FocusMed框架,通过三个核心步骤优化MQS任务:一是设计提示模板驱动LLMs从CHQs中提取忠实于原文的核心焦点,并结合语义相似度验证机制减少幻觉;二是将提取的核心焦点与原始CHQ-FAQ对结合,构建增强微调数据集,提升模型焦点识别能力;三是提出多维度质量评估与选择机制,从忠实性、简洁性和覆盖率三个维度综合提升摘要质量。
最后在MEDIQA和MeqSum两个基准数据集上进行实验,采用ROUGE、BERTScore、SUMMAC₀ₛ等指标评估,结果显示FocusMed框架在所有指标上均达到最先进水平,相比现有方法,在MEDIQA和MeqSum数据集上ROUGE-L分别提升7.3%和6.7%,同时显著减少了模型幻觉。
二、文章创新点
- 提出核心焦点引导的优化框架:首次将LLMs的

订阅专栏 解锁全文
1623

被折叠的 条评论
为什么被折叠?



