DISC-MedLLM 开源项目使用教程
1. 项目目录结构及介绍
DISC-MedLLM
项目的主要目录结构如下:
.
├── cli_demo.py # 命令行交互式演示脚本
├── eval # 模型评估相关文件
├── images # 存储项目相关图片
├── LICENSE # 项目许可证文件
├── README.md # 项目说明文件
├── README_EN.md # 项目说明文件的英文版
├── requirements.txt # 项目依赖环境列表
├── train # 模型训练相关代码
├── web_demo.py # 网页版交互式演示脚本
└── ...
cli_demo.py
: 命令行交互式演示脚本,用于本地进行模型对话演示。eval
: 包含模型评估相关文件,用于对模型进行性能评测。images
: 存储项目相关的图片文件,如模型架构图、性能对比图等。LICENSE
: 项目使用的许可证文件,本项目采用 Apache-2.0 许可。README.md
和README_EN.md
: 分别是项目的说明文件,包含项目的介绍、使用方法等,中文和英文版本。requirements.txt
: 列出了项目运行所需依赖的 Python 包。train
: 包含模型训练相关的代码,包括训练脚本和数据集等。web_demo.py
: 网页版交互式演示脚本,用于通过 Web 界面进行模型对话演示。
2. 项目的启动文件介绍
项目提供了两个启动文件,分别是 cli_demo.py
和 web_demo.py
。
-
cli_demo.py
: 用于命令行交互式演示。运行此脚本后,用户可以通过命令行与模型进行对话。运行命令如下:
python cli_demo.py
-
web_demo.py
: 用于网页版交互式演示。运行此脚本后,用户可以通过浏览器与模型进行对话。运行命令如下:
streamlit run web_demo.py --server.port 8888
3. 项目的配置文件介绍
项目的配置文件主要集中在 train
目录下,用于配置模型训练的相关参数。
在 train
目录中,有一个名为 train_args
的子目录,里面包含了模型的训练参数配置文件,例如 sft.json
。
sft.json
: 包含了模型训练时使用的参数,如学习率、批量大小、训练轮数等。
配置文件的内容大致如下(示例):
{
"num_gpus": 8,
"train_args_file": "./train_args/sft.json"
// 其他训练参数...
}
用户可以根据自己的需求调整这些参数,以达到最佳的训练效果。训练时,使用以下命令:
deepspeed --num_gpus={num_gpus} ./train/train.py --train_args_file ./train/train_args/sft.json
请将 {num_gpus}
替换为实际使用的 GPU 数量。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考