DISC-MedLLM 使用教程
1. 项目介绍
DISC-MedLLM 是一个由复旦大学数据智能与社会计算实验室(Fudan-DISC)开发的开源项目,旨在利用大型语言模型(LLMs)为端到端的医疗健康对话服务提供准确和真实的医疗响应。该模型针对医疗健康对话场景进行了优化,可以满足用户在疾病问诊和治疗方案咨询等方面的需求,提供高质量的健康支持服务。
2. 项目快速启动
在开始使用 DISC-MedLLM 前,您需要确保已经安装了以下依赖环境:
pip install -r requirements.txt
接下来,您可以使用 Hugging Face 的 transformers 模块来加载模型并进行推理:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation.utils import GenerationConfig
# 加载 tokenizer
tokenizer = AutoTokenizer.from_pretrained("Flmc/DISC-MedLLM", use_fast=False, trust_remote_code=True)
# 加载模型
model = AutoModelForCausalLM.from_pretrained(
"Flmc/DISC-MedLLM",
device_map="auto",
torch_dtype=torch.float16,
trust_remote_code=True
)
# 设置生成配置
model.generation_config = GenerationConfig.from_pretrained("Flmc/DISC-MedLLM")
# 创建对话消息列表
messages = [{"role": "user", "content": "我感觉自己颈椎非常不舒服,每天睡醒都会头痛"}]
# 生成回复
response = model.chat(tokenizer, messages)
# 打印回复
print(response)
运行上述代码后,您将得到模型对用户问题的回复。
3. 应用案例和最佳实践
应用案例
- 疾病问诊: 用户可以询问关于疾病的相关问题,例如“我最近总是发烧,是什么原因?”
- 治疗方案咨询: 用户可以咨询关于治疗方案的建议,例如“我患有糖尿病,应该注意什么?”
最佳实践
- 在使用 DISC-MedLLM 进行对话时,建议用户提供尽可能详细的症状描述,以便模型能够提供更准确的回复。
- 对于复杂或严重的医疗问题,建议用户咨询专业的医疗人员。
4. 典型生态项目
目前,DISC-MedLLM 的生态系统包括以下项目:
- DISC-Med-SFT 数据集: 用于训练 DISC-MedLLM 的数据集,包含了超过47万个样本。
- Baichuan-13B: DISC-MedLLM 所基于的基础模型。
这些项目共同构成了 DISC-MedLLM 的生态系统,为其提供支持和扩展。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考