
大模型实践
文章平均质量分 96
以实践为线索,逐步深入大模型训练和部署等各个环节,提升代码能力和四维能力。
Donvink
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【视频生成模型】通义万相Wan2.1模型本地部署和LoRA微调
本文主要是介绍通义万相视频生成模型本地部署教程,包括文生视频、图生视频和首尾帧生成视频,最后简要介绍LoRA训练Wan2.1原创 2025-04-27 15:39:21 · 1725 阅读 · 0 评论 -
【多模态大模型实战】使用LoRA微调Qwen2.5-VL
本文将直接使用 Qwen2.5-VL-7B-Instruct 模型在 coco_2014_caption 数据集上进行LoRA微调训练,旨在熟悉Qwen2.5-VL数据处理和训练流程。GitHub地址:https://github.com/Donvink/Qwen2.5-VL-Finetune原创 2025-04-12 14:04:33 · 3220 阅读 · 4 评论 -
【DeepSeek-R1背后的技术】系列十一:RAG原理介绍和本地部署(DeepSeekR1+RAGFlow构建个人知识库)
RAG(Retrieval-Augmented Generation,检索增强生成) 是一种结合了信息检索技术与语言生成模型的人工智能技术,该技术通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLMs),以增强模型处理知识密集型任务的能力,如问答、文本摘要、内容生成等。RAG模型由Facebook AI Research(FAIR)团队于2020年首次提出,并迅速成为大模型应用中的热门方案。原创 2025-02-23 20:05:15 · 2213 阅读 · 0 评论 -
【复现DeepSeek-R1之Open R1实战】系列9:有趣的现象——GRPO训练过程Loss从0开始慢慢变大
在用GRPO算法训练大模型的时候,我发现了一个很奇怪的现象:在训练过程中,Loss都是从0开始慢慢变大,最后趋于稳定。尝试了几次训练都是一样的现象。下面我们通过公式推导解释这个现象原创 2025-02-21 13:06:30 · 1216 阅读 · 0 评论 -
【复现DeepSeek-R1之Open R1实战】系列8:混合精度训练、DeepSpeed、vLLM和LightEval介绍
本文继续深入了解Open R1项目中用到的相关技术,包括训练模型用到的混合精度训练(bfloat16)、DeepSpeed、vLLM,以及评估模型用到的LightEval。原创 2025-02-20 22:25:24 · 1644 阅读 · 0 评论 -
【复现DeepSeek-R1之Open R1实战】系列7:GRPO原理介绍、训练流程和源码深度解析
本文详细介绍里GRPO的原理、流程以及详细的源码分析。原创 2025-02-20 00:06:15 · 2868 阅读 · 0 评论 -
【复现DeepSeek-R1之Open R1实战】系列6:GRPO源码结构解析
本文详细逐行深度解读GRPO源码,这里只解析GRPO独特的部分。原创 2025-02-18 23:05:11 · 1852 阅读 · 0 评论 -
【复现DeepSeek-R1之Open R1实战】系列5:SFT源码逐行深度解析
本文逐行详细解读SFT源码!原创 2025-02-18 22:06:18 · 1414 阅读 · 0 评论 -
【复现DeepSeek-R1之Open R1实战】系列4:跑通GRPO!
终于配置好flash-attention依赖库了!让我们一起跑通GRPO!原创 2025-02-17 21:17:18 · 2366 阅读 · 5 评论 -
【复现DeepSeek-R1之Open R1实战】系列3:基础知识介绍
本文先介绍HuggingFace的Open-R1项目,这是一个旨在系统性地重构DeepSeek-R1的数据集及其训练流程、验证paper里的成果,从而推进开源推理模型发展。通过构建Open-R1,阐明强化学习如何提升推理能力的,同时向开源社区分享可复现的项目,为未来基于这些技术开发新模型奠定基础。然后,再介绍一些大模型相关的概念和基础知识,如Tokenizer、SFT和GRPO等,便于大家深入去了解。掌握了这些基础概念和知识之后,我们再深入源码,逐行逐模块去分析,从而达到学会就能用的目的。原创 2025-02-17 21:01:33 · 1893 阅读 · 0 评论 -
【复现DeepSeek-R1之Open R1实战】系列2:没有卡也能训模型!Colab跑OpenR1(附源码)
在训模型之前,一定要记得修改配置文件 recipes/accelerate_configs/zero3.yaml。国内网络配置环境太头疼怎么办?让我们转移到Colab上去复现DeepSeek-R1吧!原创 2025-02-15 23:32:20 · 636 阅读 · 0 评论 -
【复现DeepSeek-R1之Open R1实战】系列1:跑通SFT(一步步操作,手把手教学)
最近DeepSeek-R1太火里,HuggingFace复现了R1,并将教程放到GitHub上里,我们趁热打铁,也来复现一下。在复现过程中,踩了很多坑,在这里记录下来,大家可以跟着一步步操作避坑。原创 2025-02-15 21:56:24 · 4283 阅读 · 10 评论 -
【DeepSeek-R1背后的技术】系列五:DeepSeek-R1微调指南
微调像 DeepSeek-R1 这样的大型 AI 模型可能需要大量资源,但如果我们能使用正确的工具,依然可以在消费级硬件上进行有效的训练。下面我们来探索如何使用 LoRA(低秩自适应)和 Unsloth 优化 DeepSeek-R1 微调,从而实现更快、更低成本的训练。在这篇博文中,我们将在消费级 GPU 上使用 LoRA(低秩自适应)和 Unsloth 对 DeepSeek-R1 进行微调。原创 2025-02-08 11:48:17 · 2870 阅读 · 0 评论 -
【DeepSeek-R1背后的技术】系列四:本地部署DeepSeek-R1,断网也能畅聊!
我们使用DeepSeek在线服务的时候,经常会遇到服务器忙的情况,非常影响体感和效率。为了解决这个问题,我们部署DeepSeek本地模型,通过Ollama提供API支持、Chatbox提供UI界面,实现断网也能使用DeepSeek!原创 2025-02-07 22:54:34 · 668 阅读 · 0 评论 -
【DeepSeek-R1背后的技术】系列一:混合专家模型(MoE)
模型规模是提升模型性能的关键因素之一。在有限的计算资源预算下,用更少的训练步数训练一个更大的模型,往往比用更多的步数训练一个较小的模型效果更佳。混合专家模型 (Mixed Expert Models,简称 MoEs) 的一个显著优势是能够在远少于稠密模型所需的计算资源下进行有效的预训练。这意味着在相同的计算预算条件下,可以显著扩大模型或数据集的规模。特别是在预训练阶段,与稠密模型相比,混合专家模型通常能够更快地达到相同的质量水平。那么,究竟什么是一个混合专家模型 (MoE) 呢?原创 2025-02-03 14:25:33 · 5592 阅读 · 0 评论 -
预训练语言模型微调和部署——《动手学大模型》实践教程第一章
从一些大模型相关的论文里学了一些理论知识,但是还是欠缺实践经验,本系列博文是在学习上交大张倬胜老师的开源项目的基础上写的相关总结,旨在提升自己的大模型实践能力。备注:本项目大部分资源都需要科学上网才能获取。免责声明本系列博文所有技巧仅供参考,不保证百分百正确。若有任何问题,欢迎联系本人。原创 2024-11-17 16:40:50 · 1150 阅读 · 8 评论 -
大模型提示学习与思维链——《动手学大模型》实践教程第二章
介绍大模型的API调用与推理指南。教程目标:1. 熟悉大语言模型的使用方式;2. 掌握零样本和少样本提示工程;3. 了解思维链推理技术。原创 2024-11-17 21:27:05 · 841 阅读 · 0 评论 -
大模型知识编辑——《动手学大模型》实践教程第三章
大模型知识编辑。教程目标:熟悉使用EasyEdit工具包;掌握语言模型的编辑方法(最简);了解不同类型的编辑方法的选型和应用场景。原创 2024-11-18 23:17:46 · 1036 阅读 · 0 评论 -
大模型水印——《动手学大模型》实践教程第四章
介绍语言模型的水印,在语言模型生成的内容中嵌入人类无法察觉,但却可以被算法检测的到的“水印”。原创 2024-11-20 23:43:58 · 1261 阅读 · 0 评论 -
大模型安全和越狱攻击——《动手学大模型》实践教程第五章
想要得到更好的安全,要先从学会攻击开始。让我们了解越狱攻击如何撬开大模型的嘴!目标:熟悉使用EasyJailbreak工具包;掌握大模型的常用越狱方法的实现与结果。原创 2024-11-21 20:34:48 · 1992 阅读 · 0 评论 -
多模态大语言模型——《动手学大模型》实践教程第六章
介绍多模态大语言模型的常见架构以及构建方法。大语言模型的出现让大家看到,高阶的智能在语言模态上得到了充分的体现。作为能够更充分模拟真实世界的多模态大语言模型,其如何实现更强大的多模态理解和生成能力?多模态大语言模型是否能够帮助实现AGI?原创 2024-11-21 21:13:26 · 1402 阅读 · 0 评论 -
大模型智能体安全——《动手学大模型》实践教程第七章
介绍大模型智能体构建与安全风险测评:了解大模型智能体的架构与常见应用;了解大模型智能体驱动的“自主操作系统”;尝试大模型智能体安全测评与分析。原创 2024-11-21 21:26:11 · 1042 阅读 · 0 评论 -
【LLaMa2入门】从零开始训练LLaMa2
从零开始学大模型之——LLaMa2-7B。原创 2024-09-21 16:58:24 · 1648 阅读 · 0 评论