医疗大模型和数据集整理

本文详细整理了医疗领域的大型模型及其应用,同时涵盖了各类重要的医疗数据集,为医疗AI研究和开发提供宝贵的资源。

医疗大模型整理

LLM

类型

基座模型

持续预训练/Finetune

评估

ClinicalGPT

论文

BLOOM-7B

cMedQA2, cMedQA-KG, MD-EHR,
MEDQA-MCMLE, and MedDialog

MedDialog

MEDQA-MCMLE

MD-HER

cMedQA2

HuatuoGPT

论文+开源项目

Baichuan-7B

Ziya-LLaMA-13B-Pretrain-v1

Distilled Instructions from ChatGPT

Real-world Instructions from Doctors

Distilled Conversations from ChatGPT

Real-world Conversations with Doctors

数据链接

cMedQA2 webMedQA

Huatuo-26M

Bianque

Bianque1.0

Bianque2.0

论文+开源项目

ChatGLM-6B

BianQueCorpus 包含

MedDialog-CN

IMCS-V2

CHIP-MDCFNPC

MedDG

cMedQA2

Chinese-medical-dialogue-data

DoctorGLM

论文+开源项目

ChatGLM-6B

CMD,MedDialog, ChatDoctor HearlthcareMagic

DISC-MedLLM

论文+开源项目

Baichuan13B-base

DISC-Med-SFT 数据集 包括MedDialog,cMedQA2,CMeKG等

MedicalGPT

开源项目

240w条中文医疗数据集  链接

ChatMed-Consult

开源项目

LLaMA-7b

50w在线问诊+ChatGPT回复 链接

QiZhenGPT

开源项目

Chinese-LLaMA-Plus-7B,CaMA-13B,ChatGLM

启真医学知识库构建的中文医学指令数据集

PULSE

开源项目

Bloomz-7b1-mt

InternLM-20B

浦医2.0新增5个开源数据集,包括SA-Med2D-20M和SNOW数据集

Me-LLAMA

英文开源项目

医疗基座大模型

LLAMA

CPT使用129B数据,包含生物医学文献,临床笔记和一般领域数据。

IT使用214k样本的医疗指令调整数据集

医疗数据集整理

详细

Llm-medical-data

链接

Chinese_medical_dialogue_data

Huatuo_llama_med_chinese_data                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            &nb

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值