手把手实操LoRA高效微调,定制垂直行业深度大模型,让你真正能懂会用

前言

今天我们来个新话题——对大模型进行微调,让通用大模型具备“特殊能力”,能够完成特定的任务

如果大家的电脑配置跑不了大模型的微调任务,可以申请阿里云ACP考试的免费试用。

老规矩,先看最终效果。

选用的原始大模型是“Qwen2.5-1.5B-Instruct” (因为足够小、足够傻)。

微调的目标是:让其具备解答数学题的能力,其他行业模型微调方法类似

任务的设计:

"在一块底边长18米,高6米的三角形菜地里种萝卜.如果每平方米收萝卜12千克,这块地可收萝卜多少千克?"

微调前的效果:分析的头头是道,但就是给不出答案

图片

微调前模型:模拟考试10道数学题,看看能得多少分?30!

图片

微调后模型:模拟考试10道数学题,看看能得多少分?70!

(为啥不是满分,文末有详述)

图片

以下是详细的实现过程。

一、在开始之前,我们先补充几个模型微调的原理知识,做好笔记哦

1)大模型的训练原理

后面会单独写一篇文章详细介绍,这里仅简介。

生成式大模型的原理就是,根据用户输入的信息,经过大模型神经网络各层的计算,把概率高的相关内容作为结果反馈给用户

那如何才能得到更精准的答案呢?

在大模型的训练过程中,需要不断地进行参数调整,让结果更加精确。大模型的训练过程,也就是参数调优的过程。

所以参数越多,控制就越精细化,效果就越好。

就好比,仅仅用身高、体重、年龄等有限特征去识别一个人,和用臂展、腿长、脸型、眼距、额宽等等更多细节特征去识别人物,效果肯定不一样。

当然参数越多,所需要的资源和时间也就会越多。

2)大模型到底是如何学习的

  • 用数学公式,通过数据找规律;

  • 根据输入,通过数学公式计算,得到输出;

  • 如果输出与预期不相符,则需要进行参数调整,用损失函数,来代表输出与预期的不相符程度

  • 参数调整的目标,就是让损失函数(代价函数)最小。那如何最小呢。

使用梯度下降法,找到最低点。

  • 那如何使用梯度下降呢。

\1. 是找调整方向。

类似二维空间的求导找斜率,以最快的角度到达最低点;

三位空间的求偏导,找二维向量以最快的角度到达最低点;

以此类推到更高维的空间;

\2. 是找调整幅度

过大可能直接跨过了最低点,太小需要太长的时间。

总结下来,模型的微调就是做以上这几件事。

3)快速微调

LoRA:(Low-Rank Adaptation)低秩适应微调,通过矩阵运算将微调需要更新的参数抽象分解成两个小得多的低秩矩阵,模型原有矩阵不训练。

通俗的讲,就是20%的矩阵,携带了80%的信息,我们只需要使用信息密度最高的那些矩阵就好了。

二、任务拆解

1、下载原始模型

2、准备训练集

3、模拟考试,用原始模型,看看答题能得多少分

4、使用ms-swift框架,设置不同的参数,进行微调

5、模拟考试,用微调后的模型,看看答题能得多少分

三、下载模型并装载

1、准备环境

1) 克隆工程并安装必要的python包

git clone https://github.com/AlibabaCloudDocs/aliyun_acp_learning.git
pip install accelerate==1.0.1 rouge-score==0.1.2 nltk==3.9.1 ms-swift[llm]==2.4.2.post2 evalscope==0.5.5rc1

图片

2)下载原始模型包并加载到内存中

图片

四、准备数据训练集

数据集使用1000+道由DeepSeek-R1生成的题解进行训练,如果数据太少,会过拟合,类似“背题”,而不是找到“解题方法”。

五、模拟考试:用原始模型做模拟考试

准备了10道测试题,原始模型只答对了3道,得分30分(满分100分)。

图片

图片

图片

六、设置不同的参数,进行多轮微调

1、参数及其含义:

learning_rate - 学习率,也就是调整幅度,太大容易跨过最低点,太小时间会太久

lora_rank - lora的秩,也就是训练模型的大小,越大信息越多,但难度越大

num_learning_epoches - 每个训练集训练的次数,太多容易过拟合,太少则可能找不到解题规律

batch_size - 一次计算平均梯度的数量,太大可以加速训练,但容易过拟合;太小训练时间会加长。

eval_steps - 评估间隔,训练多少数据进行一次评估,不能等到所有都训练完了才评估。

2、开始一步一步的微调吧。

1) 第一次微调

参数设置:

learning_rate = 0.1

lora_rank = 4

num_learning_epoches=1

通过日志:23:54:59开始跑~23:55:14跑完,大概用了1分钟

图片

图片

通过损失函数图像看:训练损失增大、验证损失增大,意味着没找到最小值

图片

原因可能就是调整幅度太大了,降低****learning_rate=0.00005

2)第二次微调

参数设置:

learning_rate = 0.00005

lora_rank = 4

num_learning_epoches=1

通过日志:大概用了3分钟

图片

通过损失函数图像看:训练损失减小、验证损失也减少但起伏不定

图片

原因可能是欠拟合,增大每个数据集的学习次数和batch_size

3)第三次微调

参数设置:

learning_rate = 0.00005

lora_rank = 4

num_learning_epoches=3

batch_size = 16

evel_step = 20

通过日志:大概用了7分半

图片

通过损失函数图像看:训练损失减小、验证损失先减少后增大

图片

原因可能是过拟合,增大数据集的数量,降低学习次数,增大lora_rank.

4)第四次微调

参数设置:

learning_rate = 0.00005

lora_rank = 8

num_learning_epoches=3

batch_size = 16

evel_step = 20

通过日志:大概用了5分半

图片

通过损失函数图像看:训练损失减小、验证损失也平滑的减少

图片

原因,训练已经接近成功,多训练就好了。增加每次训练的题量。

5)第五次微调 - 微调成功:

参数设置:

learning_rate = 0.00005

lora_rank = 8

num_learning_epoches=15

batch_size = 16

evel_step = 20

通过日志:大概用了25分钟

图片

通过损失函数图像看:训练损失和验证损失基本不变

图片

微调成功!

七、用微调后模型,进行模拟考试

注意:一定要选取训练过程中表现最好的checkpoint

图片

微调后,得分从微调前30分提升到70分!

图片

为啥还没到满分呢。

比如,针对天数计算,例如是否要+1问题还是不行;最小公倍数也算错了!!!

原因:模型的训练量还是太小!后续可以通过增加训练量来提升。

好了,今天的手把手lora实操大模型微调原理和实践就到这儿来。希望这篇能帮到你~

最后

为什么要学AI大模型

当下,⼈⼯智能市场迎来了爆发期,并逐渐进⼊以⼈⼯通⽤智能(AGI)为主导的新时代。企业纷纷官宣“ AI+ ”战略,为新兴技术⼈才创造丰富的就业机会,⼈才缺⼝将达 400 万!

DeepSeek问世以来,生成式AI和大模型技术爆发式增长,让很多岗位重新成了炙手可热的新星,岗位薪资远超很多后端岗位,在程序员中稳居前列。

在这里插入图片描述

与此同时AI与各行各业深度融合,飞速发展,成为炙手可热的新风口,企业非常需要了解AI、懂AI、会用AI的员工,纷纷开出高薪招聘AI大模型相关岗位。
在这里插入图片描述
最近很多程序员朋友都已经学习或者准备学习 AI 大模型,后台也经常会有小伙伴咨询学习路线和学习资料,我特别拜托北京清华大学学士和美国加州理工学院博士学位的鲁为民老师给大家这里给大家准备了一份涵盖了AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频 全系列的学习资料,这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效地掌握AI大模型的各个知识点。

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

AI大模型系统学习路线

在面对AI大模型开发领域的复杂与深入,精准学习显得尤为重要。一份系统的技术路线图,不仅能够帮助开发者清晰地了解从入门到精通所需掌握的知识点,还能提供一条高效、有序的学习路径。

img

但知道是一回事,做又是另一回事,初学者最常遇到的问题主要是理论知识缺乏、资源和工具的限制、模型理解和调试的复杂性,在这基础上,找到高质量的学习资源,不浪费时间、不走弯路,又是重中之重。

AI大模型入门到实战的视频教程+项目包

看视频学习是一种高效、直观、灵活且富有吸引力的学习方式,可以更直观地展示过程,能有效提升学习兴趣和理解力,是现在获取知识的重要途径

在这里插入图片描述
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

海量AI大模型必读的经典书籍(PDF)

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。
在这里插入图片描述

600+AI大模型报告(实时更新)

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

AI大模型面试真题+答案解析

我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下
在这里插入图片描述

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值