LLMs之Medical:大语言模型纵向赋能场景—垂直行业场景应用之大模型医疗行业的简介、主流LLMs(ChatGLM-Med/ChatDoctor/Radiology-GPT/Med-PaLM/Qilin-Med等)及其评估基准(包括数据集)、案例应用之详细攻略
目录
1、主流LLMs:ChatGLM-Med/ChatDoctor/Radiology-GPT/Qilin-Med
2023年3月,ChatGLM-Med:基于ChatGLM模型+微调中国医学指令数据集(基于GPT3.5的API和医学知识图谱创建问题-答案对)
2023年4月18日,ChatDoctor:基于LLaMA模型+微调Alpaca指令数据集和HealthCareMagic100k患者-医生对话数据集且检索外部知识数据库
2023年6月14日,Radiology-GPT针对放射学领域:基于Alpaca+微调放射学领域知识数据集,两元组{发现,结论}
2023年6月15日,Med-PaLM 2,基于PaLM 2+医学领域微调和提示策略(包括一种新的集成优化方法)
2023年10月13日,Qilin-Med,基于BaiChuan-7B+多阶段训练方法(CPT增量/持续预训练阶段→SFT有监督微调阶段→RKHF的DPO直接偏好优化阶段)
《Qilin-Med: Multi-stage Knowledge Injection Advanced Medical Large Language Model》翻译与解读
2022年,MultiMedQA(医学QA+评估LLMs临床知识和QA能力)
大模型医疗行业的案例应用—医疗应用四大方面:医学问答、医学考试、医学教育、医学助理
医学问答:医学问答任务表现不错,但临床实用性有限(源于LLMs的引用不可靠和捏造信息)
医学考试:接近及格门槛、有潜力(医学教育+临床决策+回答医学解释)、比谷歌搜索更具有上下文感知力和演绎推理性(毕竟谷歌只是搜索呀)
医学助理:有潜力也存在挑战(缺乏原创性+高输入+资源限制+回答不确定性)