医疗大模型整理
| LLM |
类型 |
基座模型 |
持续预训练/Finetune |
评估 |
| ClinicalGPT |
论文 |
BLOOM-7B |
cMedQA2, cMedQA-KG, MD-EHR, |
MedDialog MEDQA-MCMLE MD-HER cMedQA2 |
| HuatuoGPT |
论文+开源项目 |
Baichuan-7B Ziya-LLaMA-13B-Pretrain-v1 |
Distilled Instructions from ChatGPT Real-world Instructions from Doctors Distilled Conversations from ChatGPT Real-world Conversations with Doctors |
cMedQA2 webMedQA Huatuo-26M |
| Bianque Bianque1.0 Bianque2.0 |
论文+开源项目 |
ChatGLM-6B |
BianQueCorpus 包含 MedDialog-CN IMCS-V2 CHIP-MDCFNPC MedDG cMedQA2 Chinese-medical-dialogue-data |
|
| DoctorGLM |
论文+开源项目 |
ChatGLM-6B |
CMD,MedDialog, ChatDoctor HearlthcareMagic |
|
| DISC-MedLLM |
论文+开源项目 |
Baichuan13B-base |
DISC-Med-SFT 数据集 包括MedDialog,cMedQA2,CMeKG等 |
|
| MedicalGPT |
开源项目 |
240w条中文医疗数据集 链接 |
||
| ChatMed-Consult |
开源项目 |
LLaMA-7b |
50w在线问诊+ChatGPT回复 链接 |
|
| QiZhenGPT |
Chinese-LLaMA-Plus-7B,CaMA-13B,ChatGLM |
启真医学知识库构建的中文医学指令数据集 |
||
| PULSE |
开源项目 |
Bloomz-7b1-mt InternLM-20B |
浦医2.0新增5个开源数据集,包括SA-Med2D-20M和SNOW数据集 |
|
| Me-LLAMA |
英文开源项目 医疗基座大模型 |
LLAMA |
CPT使用129B数据,包含生物医学文献,临床笔记和一般领域数据。 IT使用214k样本的医疗指令调整数据集 |
医疗数据集整理
| 详细 |
||
| Llm-medical-data |
Chinese_medical_dialogue_data Huatuo_llama_med_chinese_data &nb |

本文详细整理了医疗领域的大型模型及其应用,同时涵盖了各类重要的医疗数据集,为医疗AI研究和开发提供宝贵的资源。
最低0.47元/天 解锁文章
28万+

被折叠的 条评论
为什么被折叠?



