DISC-MedLLM 项目使用教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00635/article/details/147007344

DISC-MedLLM 项目使用教程

DISC-MedLLM Repository of DISC-MedLLM, it is a comprehensive solution that leverages Large Language Models (LLMs) to provide accurate and truthful medical response in end-to-end conversational healthcare services. 项目地址: https://gitcode.com/gh_mirrors/di/DISC-MedLLM

1. 项目目录结构及介绍

DISC-MedLLM 项目的目录结构如下：

.
├── cli_demo.py           # 命令行界面演示脚本
├── eval                 # 评估相关文件
├── images               # 项目图像文件
├── LICENSE              # Apache-2.0 许可文件
├── README.md            # 项目说明文件
├── README_EN.md         # 项目说明文件（英文版）
├── requirements.txt     # 项目依赖环境列表
├── train                # 训练相关文件
├── web_demo.py          # 网页版演示脚本

cli_demo.py: 命令行界面的演示脚本，用于展示如何使用 DISC-MedLLM 进行交互。
eval: 包含评估模型的测试数据集、模型生成的对话结果以及评估分数。
images: 存放项目的图像文件，如模型架构图、项目流程图等。
LICENSE: 项目的许可文件，采用 Apache-2.0 开源协议。
README.md 和 README_EN.md: 分别为项目的中文和英文说明文件，详细介绍了项目背景、功能、使用方法等。
requirements.txt: 列出了项目所需的 Python 库和依赖环境。
train: 包含训练模型所需的代码和数据。
web_demo.py: 网页版的演示脚本，可以用来在网页上展示 DISC-MedLLM 的交互功能。

2. 项目的启动文件介绍

项目的启动文件有两个：cli_demo.py 和 web_demo.py。

cli_demo.py: 命令行界面演示脚本。运行该脚本后，用户可以通过命令行与 DISC-MedLLM 进行交互。使用方法如下：
```
python cli_demo.py
```
web_demo.py: 网页版演示脚本。运行该脚本后，用户可以通过浏览器与 DISC-MedLLM 进行交互。使用方法如下：
```
streamlit run web_demo.py --server.port 8888
```

3. 项目的配置文件介绍

项目的配置文件主要集中在 train 目录下的 train_args/sft.json 文件中。

train_args/sft.json: 训练模型的参数配置文件。其中包括了训练所需的参数，如数据集路径、训练批次大小、学习率等。用户可以根据自己的需求修改这些参数。

在开始训练前，请确保已经正确配置了 train_args/sft.json 文件中的所有参数。训练模型时，可以使用以下命令：

deepspeed --num_gpus={num_gpus} ./train/train.py --train_args_file ./train/train_args/sft.json

其中 {num_gpus} 需要替换为实际使用的 GPU 数量。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考