LLaMA-Factory微调大模型Qwen2.5

1、开始ModelScope社区GPU环境

训练或微调模型都是非常耗费算力的。如果电脑的配置不高,可使用一些云服务器来做这项工作。如ModelScope(魔搭)社区的GPU环境,目前提供36小时免费运算,足够微调一个大模型了。

注册ModelScope(魔搭)社区账号(可能还要注册或认证阿里云账号),进入“我的NoteBook”:

我的Notebook · 魔搭社区

启动大概需要2分钟,等GPU环境启动好以后点击"查看NoteBook"进入。

开启后,会提示永久性数据只保存在/mnt/workspace/目录下。

魔塔社区内置了JupyterLab的功能,进入之后,可以找到 Notebook 标签,新建一个Notebook(当然你在terminal 里执行也没问题)。

如下箭头所示,点击即可创建一个新的 Notebook 页面。

2、克隆LLaMA-Factory

(如果使用本地电脑进行微调,以下步骤都可参考)

打开NoteBook的终端,在默认目录(/mnt/workspace/)下执行命令:

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

建议使用--depth 1参数,将data及一些示例的训练数据下载下来,以便修改微调。

3、配置环境

3.1、创建虚拟环境

进入LLaMA-Factory目录:

cd LLaMA-Factory/

创建虚拟环境:

python -m venv env  # env为虚拟环境文件夹名称,可自定义,如llama-factory-env

激活虚拟环境:NoteBook终端是linux系统,激活虚拟环境命令如下(同macOS):

source env/bin/activate # env为创建的虚拟环境名称

如果是windows系统,使用如下命令激活虚拟环境:

env\Scripts\activate

注意:重启NoteBook后,记得先激活虚拟环境!

3.2、安装依赖

安装必要的依赖,如:

pip install --upgrade pip     # 更新pip
pip install bitsandbytes>=0.39.0 

3.3、安装LLaMA-Factory

使用以下命令安装:

pip3 install -e ".[torch,metrics]"

4、模型下载测试

4.1、下载模型

首先下载LLM大语言模型,这里使用QWen2.5-0.5B,参数5亿个,微调时间短,在低配置电脑上也能运行。

模型在魔搭社区上有,地址是:

https://www.modelscope.cn/models/Qwen/Qwen2.5-0.5B-Instruct/summary

将目录回退到/mnt/workspace/,根据网页提

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

will.hu

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值