DISC-MedLLM 项目使用教程
1. 项目目录结构及介绍
DISC-MedLLM 项目的目录结构如下:
.
├── cli_demo.py # 命令行界面演示脚本
├── eval # 评估相关文件
├── images # 项目图像文件
├── LICENSE # Apache-2.0 许可文件
├── README.md # 项目说明文件
├── README_EN.md # 项目说明文件(英文版)
├── requirements.txt # 项目依赖环境列表
├── train # 训练相关文件
├── web_demo.py # 网页版演示脚本
cli_demo.py
: 命令行界面的演示脚本,用于展示如何使用 DISC-MedLLM 进行交互。eval
: 包含评估模型的测试数据集、模型生成的对话结果以及评估分数。images
: 存放项目的图像文件,如模型架构图、项目流程图等。LICENSE
: 项目的许可文件,采用 Apache-2.0 开源协议。README.md
和README_EN.md
: 分别为项目的中文和英文说明文件,详细介绍了项目背景、功能、使用方法等。requirements.txt
: 列出了项目所需的 Python 库和依赖环境。train
: 包含训练模型所需的代码和数据。web_demo.py
: 网页版的演示脚本,可以用来在网页上展示 DISC-MedLLM 的交互功能。
2. 项目的启动文件介绍
项目的启动文件有两个:cli_demo.py
和 web_demo.py
。
-
cli_demo.py
: 命令行界面演示脚本。运行该脚本后,用户可以通过命令行与 DISC-MedLLM 进行交互。使用方法如下:python cli_demo.py
-
web_demo.py
: 网页版演示脚本。运行该脚本后,用户可以通过浏览器与 DISC-MedLLM 进行交互。使用方法如下:streamlit run web_demo.py --server.port 8888
3. 项目的配置文件介绍
项目的配置文件主要集中在 train
目录下的 train_args/sft.json
文件中。
train_args/sft.json
: 训练模型的参数配置文件。其中包括了训练所需的参数,如数据集路径、训练批次大小、学习率等。用户可以根据自己的需求修改这些参数。
在开始训练前,请确保已经正确配置了 train_args/sft.json
文件中的所有参数。训练模型时,可以使用以下命令:
deepspeed --num_gpus={num_gpus} ./train/train.py --train_args_file ./train/train_args/sft.json
其中 {num_gpus}
需要替换为实际使用的 GPU 数量。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考