LLaMA-Factory 微调LLaMA3

LoRA介绍

LoRA(Low-Rank Adaptation)是一种用于大模型微调的技术, 通过引入低秩矩阵来减少微调时的参数量。在预训练的模型中, LoRA通过添加两个小矩阵B和A来近似原始的大矩阵ΔW,从而减 少需要更新的参数数量。具体来说,LoRA通过将全参微调的增量 参数矩阵ΔW表示为两个参数量更小的矩阵B和A的低秩近似来实 现:

• [ W_0 + \Delta W = W_0 + BA ] • 其中,B和A的秩远小于原始矩阵的秩,从而大大减少了需要更新 的参数数量。

LLaMA-Factory 框架

首先需要通过vscode连接远程服务器哦

如果是租赁的AutoDL服务器,一定要将模型下载到数据盘。

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .

准备训练数据

训练数据: fintech.json identity.json 将训练数据放在 LLaMA-Factory/data/fintech.json

并且修改数据注册文件:LLaMA-Factory/data/dataset_info.json

 "fintech": {
 "file_name": "fintech.json",
 "columns": {
 "prompt": "instruction",
 "query": "input",
 "response": "output",
 "history": "history"
 }
 }

启动 Web UI

cd LLaMA-Factory

llamafactory-cli webui

vscode自带端口转发,不需要进行内网穿透了。

一定要在LLaMA-Factory 目录下启动。

模型准备

pip install modelscop #安装modelscope平台

sdk方式下载模型,同时可以查看模型整体的大小和权重。

模型微调,微调 Llama-3.2-1B-Instruct 模型

### 查找与 LLaMA-Factory 相关的 Docker 配置 对于 LLaMA-Factory 的 Docker 镜像配置,通常会涉及到创建一个 `Dockerfile` 来定义运行环境以及安装必要的依赖项。基于已有的信息[^1],可以构建如下所示的一个简单的 `Dockerfile`: ```dockerfile # 使用官方的基础 Python 镜像作为起点 FROM python:3.9-slim-buster # 设置工作目录 WORKDIR /app # 安装 SSH 服务器以便 PyCharm 进行远程调试连接 RUN apt-get update && \ apt-get install -y openssh-server && \ mkdir /var/run/sshd && \ echo 'root:screencast' | chpasswd && \ sed -i 's/#PermitRootLogin prohibit-password/PermitRootLogin yes/' /etc/ssh/sshd_config # 确保允许 root 用户通过 SSH 登录并设置密码认证 RUN sed 's@session\s*required\s*pam_loginuid.so@session optional pam_loginuid.so@g' -i /etc/pam.d/sshd # 将主机上的代码复制到容器内 COPY . . # 如果有特定于项目的依赖,则在此处安装它们 RUN pip install --upgrade pip && \ pip install -r requirements.txt # 暴露用于SSH连接的端口 EXPOSE 22 # 启动命令 CMD ["bash", "-c", "service ssh start && tail -f /dev/null"] ``` 此文件假设项目根目录下存在名为 `requirements.txt` 文件来指定Python包需求。 为了使上述配置生效,在本地机器上还需要执行一些额外的操作,比如构建镜像和启动容器实例: ```shell # 构建自定义镜像 docker build -t llamafactory-image . # 创建并运行容器, 映射外部5008端口至内部22端口供PyCharm访问 docker run -d -p 5008:22 --name llama-container llamafactory-image ``` 以上操作完成后就可以利用 PyCharm 实现对 LLaMA-Factory 服务容器内的应用进行远程开发与调试了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值