论文下载地址:https://www.thelancet.com/journals/landig/article/PIIS2589-7500(23)00202-9/fulltext
目的:使用经过微调的大型语言模型(LLM)来解析患有肌肉骨骼疼痛障碍的临床记录,提取疼痛的特征(如部位和急性程度)。
方法:收集了26551份含有“疼痛”一词的患者记录,由专业人员手动标注了1714份记录的疼痛部位和急性程度,然后将标注转化为简短的句子,与原始记录和一个样本指令配对。使用这些数据对一个公开可用的基础语言模型LLaMA-7B进行了微调,同时也使用了一个包含非医疗相关的一般指令和预期响应的公开数据集Alpaca进行了微调。将微调后的模型的性能与已建立的基线模型架构(如BERT和Longformer)进行了比较。
结果:在解析肌肉骨骼疼痛的部位和急性程度方面,微调后的LLaMA-7B模型在绝大多数情况下都优于基线模型。微调后的LLaMA-7B模型还具有降低复杂性、适应不同任务、提高可解释性等优点。
结论:预训练的LLM可以作为一个强大的基础,用于创建微调后的模型,能够有效地解析非结构化的临床记录。这些模型可以作为专门的对话代理或聊天机器人,帮助临床医生快速获取相关的患者病史,保护数据隐私,优化临床工作流程。
大语言模型(LLM)|ChatGPT相关文章(以下点击可阅读):
AI超大模型!一个午休就能读完20万篇论文、提取信息完成生物数据库更新!
两篇Nature:AI实现新材料的快速合成!17天独自创造41种新材料