LLaMA-Factory 全参微调 Qwen2.5-1.5B

前言

大家好,我是小S,一枚提前“上岸”的实习生——学校放假早,运气不错,实习抢到了速珀云大模型微调的坑位。今天想聊聊这段初探大模型微调的经历,自己的血泪史,希望能帮后来的小伙伴避避坑。

过年DeepSeek爆火,大模型微调的名头随处可见。但作为一个学生党,拦路虎永远是——算力。毕竟我自己的电脑只是区区 1060,以前可是霸榜过 Steam 排行榜的超级显卡;然而,面对动辄数十GB显存需求的大模型?它连加载都成问题。

云平台选择

作为实习生,我的“天然优势”就是能快速接入公司自建的AI云平台,关键的是,居然让我薅到了4090的羊毛! 平台上有专门的 “限时特价区”,价格对实习生钱包极其友好(划重点:这个活动目前长期有效!),从连模型都加载不了的1060,到拥有24GB显存的RTX 4090,这算力跃迁,堪称降维打击。

我这里租用的是 6 卡,穷怕了,怕显存不够给干崩溃了,因为全参微调真的很吃显存。

> 注意:这个平台的 AI 镜像是支持 LLaMA-Factory 的,就相当于你只要选了 PyTorch 的 2.4 版本以上的镜像,然后只需要启动实例,就可以在控制台的实例列表中找到 LLaMA-Factory 的入口了。

环境准备

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值