360-LLaMA-Factory安装与配置指南

360-LLaMA-Factory安装与配置指南

360-LLaMA-Factory adds Sequence Parallelism into LLaMA-Factory 360-LLaMA-Factory 项目地址: https://gitcode.com/gh_mirrors/36/360-LLaMA-Factory

1. 项目基础介绍

360-LLaMA-Factory 是一个开源项目,基于 LLaMA-Factory 框架,增加了序列并行性(Sequence Parallelism,简称 SP)支持。该项目主要用于大型语言模型(LLM)的后续训练,如 Soft Prompt Tuning(SFT)和 Dynamic Personalization of Objectives(DPO)等。主要编程语言为 Python。

2. 关键技术和框架

  • 序列并行性(SP): 通过序列并行性技术,可以在多个 GPU 上并行处理单个序列的数据,从而提升训练效率。
  • 深度学习框架: 基于 PyTorch 和 Huggingface 的 Transformers。
  • 分布式训练框架: 使用 DeepSpeed 进行多 GPU 分布式训练。
  • 优化技术: 集成了 ring-flash-attention 和其他优化技术,以提高训练性能。

3. 安装与配置

准备工作

在开始安装之前,请确保您的系统中已经安装了以下依赖:

  • Python 3.11(推荐版本)
  • Git
  • Conda 或其他 Python 环境管理工具

安装步骤

步骤 1:创建 Python 环境

打开命令行,创建一个新的 Python 环境(推荐使用 Conda):

conda create -n 360-llama-factory python=3.11 -y
步骤 2:激活环境

激活刚刚创建的环境:

conda activate 360-llama-factory
步骤 3:克隆项目

从 GitHub 克隆项目到本地:

git clone https://github.com/Qihoo360/360-LLaMA-Factory.git
步骤 4:安装依赖

进入项目目录,安装项目依赖:

cd 360-LLaMA-Factory
pip install -e ".[torch,metrics,deepspeed]"

如果您的环境中已经安装了 LLaMA-Factory 和其他相关依赖,可以选择增量安装:

# 安装 ring-flash-attn 和 flash-attn
pip install --no-deps ring-flash-attn
pip install flash-attn
# 如果之前安装了原始的 LLaMA-Factory,需要卸载
pip uninstall llamafactory
# 安装 360-LLaMA-Factory
pip install --no-deps -e .
步骤 5:配置参数

在开始训练之前,需要配置 .yaml 文件中的 sequence_parallel_sizecutoff_len 参数,以启用序列并行性。

例如,在配置文件中设置:

sequence_parallel_size: 4
cutoff_len: 128000

或者在命令行中设置这些参数:

deepspeed --hostfile=8nodes.host src/train.py \
--sequence_parallel_size 4 \
--cutoff_len 128000 \
...

完成以上步骤后,您就可以开始使用 360-LLaMA-Factory 进行模型训练了。

注意:以上步骤为基本的安装和配置过程,具体的使用方法请参考项目的官方文档。

360-LLaMA-Factory adds Sequence Parallelism into LLaMA-Factory 360-LLaMA-Factory 项目地址: https://gitcode.com/gh_mirrors/36/360-LLaMA-Factory

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

洪淼征

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值