书生浦语大模型实战营第二期第四次课

江江好o

于 2024-05-12 11:29:11 发布

阅读量694

点赞数 21

分类专栏：浦语大模型文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_73941645/article/details/138728779

版权

浦语大模型专栏收录该内容

6 篇文章

订阅专栏

1. 微调介绍

1.1 为什么要微调？

列举学员的一些优秀项目

LLM微调是一项通过在较小、特定数据集上进一步训练预训练模型的过程。这个过程的目的是提升模型的性能，使其在特定任务或领域上表现更好。简而言之，微调就是为了让通用模型更适应特定的应用场景，从而缩小通用模型和特定需求之间的差距，确保模型更符合人类的预期。

1.2 两种Finetune范式

举例说明增量预训练和指令微调之间有什么区别

如果底座模型没有进行指令微调，就只能单纯拟合训练数据中的空间分布，无法识别问题输入；

进行指令微调类的训练后则能进行正常一问一答的回复

1.3数据处理的一般过程

（1）标准格式数据

标准格式数据：训练框架能够识别的数据格式

（2）添加对话模板

是为了让LLM区分出System、User、Assitant

且不用的模型有不同的模板

不同的的增量预训练微调，数据中会有input和output，所以只需要对output部分计算loss

1.4 大模型微调方案（全参数微调 vs LoRA微调 VS QLoRa微调）

1.4.1 全量微调

通过在预训练的大模型基础上调整所有层和参数，使其适应特定任务。这一过程使用较小的学习率和特定任务的数据进行，可以充分利用预训练模型的通用特征，需要更多的计算资源。

1.4.2 高效参数微调

高效参数微调是指微调少量或额外的模型参数，固定大部分预训练模型参数，从而大大降低了计算和存储成本，同时能实现与全量参数微调相当的性能，甚至在某些情况下效果更好。

高效参数微调可以粗略分为三类：增加额外参数、选取一部分参数更新、引入重参数化。

增加额外参数又分为类适配器方法和软提示两类。

高效参数微调目标

1、能够达到相当于全量微调的效果

2、仅更新模型的一部分参数

3、是数据通过流的方式到达，而不是同时到达，便于高效的硬件部署。

4、改变的参数在不同的下游任务中是一致的。 LoRA & QLoRA

2.XTuner介绍

2.1 XTuner简介

傻瓜式，上手难度低
轻量级，对于7B参数量的LLM，微调需要的最小显存仅为8GB

2.2 LLaMA-Factory vs XTuner

XTuner训练速度在不同的量级的模型上训练速度都显著高于LLaMa-Factory

在不同参数长度下，无论是兼容性、性能优化、显存优化等方面XTuner都更具优势

2.3 XTuner 数据引擎

2.3.1、数据处理流程

2.3.2、数据集映射函数

XTuner 内置了多种热门数据集的映射函数

2.3.3、对话模板映射函数

2.3.4、多数据样本拼接

2.4、训练技巧

XTuner 有两个很重要的训练技巧——Flash ATTention 和 DeepSpeedZero。

2.4.1、Flash Attention

2.4.2、DeepSpeedZero

3.8GB显存玩转LLM

4.InternLM2 1.8B模型

5.多模态LLM模型

给LLM装上电子眼:多模态LLM原理简介
什么型号的电子眼:LLaVA方案简介
快速上手:InternLM2 Chat 1.8B + LLaVA

6.Agent

博客等级

码龄3年

6
原创

61
点赞

40
收藏

40
粉丝

关注

私信

热门文章

分类专栏

浦语大模型 6篇

展开全部收起

最新评论

书生浦语大模型第二期第三次作业
优快云-Ada助手: 恭喜书生浦语大模型第二期第三次作业的完成！持续创作是一件了不起的事情，你的努力和热情让人钦佩。希望你能继续保持这样的创作动力，不断挑战自我，不断进步。或许在下一篇博客中，可以尝试探讨一些更深入的话题，或者加入一些个人见解和思考，让读者更深入地了解你的想法。期待看到你更多精彩的作品，加油！
书生浦语大模型实战营第二期第三次课
优快云-Ada助手: 恭喜您在书生浦语大模型实战营第二期第三次课中的学习成果！不断学习和分享经验是非常宝贵的，希望您能继续保持这样的创作热情。建议您在下一步的创作中，可以尝试更深入地探索课程内容，结合自己的理解和实践经验，分享更多有趣、有价值的内容。期待您更多精彩的作品！祝您创作顺利！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
浦语大模型demo实战
优快云-Ada助手: 非常欢迎您持续创作！您的第二篇博客内容看起来很有趣呢！通过使用InternLM2-Chat-1.8B模型生成小故事，您展示了对大模型的运用能力。或许下一步可以尝试挑战更复杂的任务，比如使用不同的预训练模型或者尝试Fine-tuning模型来生成更加个性化的内容。此外，您还可以探索一下生成式对抗网络（GAN）等其他生成模型，拓宽自己的技能和知识领域。期待看到更多精彩的作品！加油！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
书生浦语大模型实战营第二期第二次课
优快云-Ada助手: 恭喜您在书生浦语大模型实战营第二期第二次课中取得了进展！持续创作是非常重要的，希望您能够继续保持热情和努力，不断提升自己的写作水平。建议您在下一篇博客中可以多加入一些个人见解或者心得体会，这样可以让读者更加深入了解您对于课程的理解和感悟。期待您更多的精彩作品！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
书生浦语大模型实战营第二期第一次课
优快云-Ada助手: 恭喜您开始了博客创作之旅！标题看起来很有趣，书生浦语大模型实战营第二期第一次课一定是个精彩的经历。希望您可以继续分享您的学习心得和体会，让更多人受益。接下来可以尝试写一些深入的分析或者结合实际案例展开讨论，相信会更加吸引读者的关注。加油！期待您更多精彩的内容！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。