Knowledge-tuning Large Language Models with Structured Medical Knowledge Bases for Reliable Response

828 篇文章

已下架不支持订阅

文章探讨了大型语言模型在医疗领域因缺乏领域知识导致的问题,并提出知识调优方法,结合结构化医学知识库,增强LLM的响应生成准确性。cMedKnowQA数据集用于评估,实验显示这种方法提高了模型的可靠性和领域适应性。

本文是LLM系列的文章,针对《Knowledge-tuning Large Language Models with Structured Medical Knowledge Bases for Reliable Response Generation in Chinese》的翻译。

具有结构化医学知识库的知识调整大型语言模型用于中文可靠响应生成

摘要

大型语言模型(LLM)在一般领域的各种自然语言处理(NLP)任务中取得了显著的成功。然而,由于领域知识有限,LLM有时会产生对医学事实的幻觉反应。这些缺点对LLM在医疗环境中的使用构成潜在风险。为了应对这一挑战,我们提出了知识调优,它利用LLM的结构化医学知识库来有效地掌握领域知识,并促进可靠的响应生成。我们还发布了cMedKnowQA,这是一个由医学知识库构建的中文医学知识问答数据集,用于评估LLM的医学知识熟练程度。实验结果表明,与普通指令调优相比,使用cMedKnowQA进行知识调优的LLM在响应生成方面可以表现出更高的准确性,并为LLM的领域自适应提供了一种新的可靠方法。

引言

相关工作

方法

实验

讨论

结论

在本文中,我们讨论了LLM生成的应答中医学事实的知识不准确问题,这对医学领域的应用至关重要,尤其是在汉语中。我们提出了一种称为知识调优的新方法,该方法利用医学知识函数作为LLM的插件助手,以有效地掌握领域知识并提高响应生成的可靠性。通过在我们提出的中国医

已下架不支持订阅

### 大型语言模型的微调方法和技术 #### 微调概述 在机器学习领域,大型语言模型(LLMs)通过预训练获得广泛的语言理解能力。然而,在特定应用场景下,这些模型通常需要进一步调整以适应具体任务的需求。此过程称为微调[^1]。 #### 常见微调策略 ##### 参数高效微调技术 参数高效的微调旨在减少所需更新参数的数量,从而降低计算成本并提高效率。一种流行的方法是低秩自适应(LoRA),该方法仅修改原矩阵的一个较低维度子空间中的权重向量,其中`r`表示秩,远小于模型总参数数量d_model。这种方法显著减少了参与优化过程的有效参数数目,使得资源受限环境下的部署成为可能[^3]。 ```python from peft import get_peft_config, PeftModelForSequenceClassification import torch.nn as nn peft_config = get_peft_config(peft_type="LORA", r=8) model = PeftModelForSequenceClassification.from_pretrained(pretrained_model_name_or_path='bert-base-uncased', config=peft_config) for param in model.base_model.parameters(): param.requires_grad_(False) lora_modules = ['q_proj', 'v_proj'] for name, module in model.named_modules(): if any(nm in name for nm in lora_modules): for p in module.parameters(): p.requires_grad_(True) ``` ##### 数据增强与正则化 为了防止过拟合以及提升泛化性能,可以采用数据扩充技术和适当的正则项来改进微调流程。这不仅有助于保持原有知识结构不变,还能使新学到的信息更加鲁棒可靠。 #### 实践建议 当处理不同规模的数据集时,应谨慎选择合适的批量大小(batch size)和学习率(learning rate),因为它们直接影响收敛速度及最终效果的好坏。此外,对于某些特殊场景而言,冻结部分层或引入额外监督信号也可能带来意想不到的好处[^2]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值