Day26下 - 大语言模型的训练train 和微调fine-tune 的区别

最新推荐文章于 2026-01-10 08:28:41 发布

原创

最新推荐文章于 2026-01-10 08:28:41 发布 · 1.1k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#语言模型 #学习 #人工智能

大语言模型学习的重点：

模型的训练 / 微调
部署模型
上层开发（以 LangChain 家族为核心）
- Open API
- Prompt 开发
- RAG 开发
- Agent 开发

训练 train 和微调 fine-tune 的区别

共同点：

都是修改模型的参数

训练：

从零开始，训练一个大模型
类似买一块布，手动做一条裤子
数据量：
- 预训练 18T
时间：
- 2个月
训练平台：
- 千卡
- 万卡
- H100，A100

微调：

从别人训练号的开源大模型开始，去做一个具体任务微调
类似买一条成品裤，根据腿长剪裤脚
数据量：
- 几十条起
时间：
- 几分钟起
训练平台：
- 能把模型放下即可
- 4090

三阶段：

第一阶段：预训练

Pre-Train
内功修炼
往往是厂家来做
自监督

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

CSBLOG

关注关注

19
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【ChatGPT模型精调训练】AI 大模型精调 Fine-Tuning （微调）训练图文代码实战详解

03-09

2468

选择预训练模型：选择一个在类似任务上已经训练好的模型作为起点。数据准备：准备并预处理你的数据集，使其适合模型的输入格式。微调：在你的特定数据集上继续训练模型，调整模型的权重。评估：评估微调后模型的性能。应用：将微调后的模型部署到实际应用中。Fine-Tuning（精调）是指在预训练模型的基础上，对模型进行微调，使其适应特定任务。预训练模型通常在大量无标签数据上进行训练，以学习通用的语言表示。通过 Fine-Tuning，我们可以在较小的标签数据集上训练模型，以便模型能够更好地解决特定任务。

Pytorch-day09-模型微调-checkpoint

weixin_39107270的博客

08-21

1659

数据集3 - 数据量大，数据相似度低 - 在这种情况下，由于我们有一个大的数据集，我们的神经网络训练将会很有效。但是，由于我们的数据与用于训练我们的预训练模型的数据相比有很大不同。然后，我们可以使用在预先训练的模型中的权重来重新训练该模型。数据集2 - 数据量少，数据相似度低 - 在这种情况下，我们可以冻结预训练模型的初始层（比如k层），并再次训练剩余的（n-k）层。数据集1 - 数据量少，但数据相似度非常高 - 在这种情况下，我们所做的只是修改最后几层或最终的softmax图层的输出类别。

参与评论您还未登录，请先登录后发表或查看评论

【大模型系列篇】初探Unsloth微调DeepSeek-R1蒸馏模型

木亦汐丫

02-27

2940

🔥🔥🔥 本文初探使用Unsloth微调DeepSeek-R1蒸馏模型DeepSeek-R1-Distill-Qwen-7B，使用了COT思维链数据进行Lora微调，微调后模型合并权重导出，并使用llama.cpp进行gguf格式转换和量化，通过ollama创建并加载模型，进行部署。

day2--ULMFIT语言模型

Aaadsda414114的博客

01-04

1000

ULMFIT模型 ULMFIT和其它模型算法的比较上篇介绍了ELMo。ELMo有以下几个步骤：利用LM任务进行预训练，再利用目标领域的语料对LM模型做微调，最后针对目标任务进行最后的训练 ULMFiT一样需要执行上述步骤。它的论文名字(Universal Language Model Fine-tuning for Text Classification)顾名思义就是一个利用LM模型给出的统一的在文本分类方面进行transfer learning的解决方案。一直以来都有人试图在NLP领域进

微调大模型（Finetuning Large Language Models）—Why Finetune（一）

l8947943的博客

09-26

880

微调就是将诸如GPT-3之类的通用模型专门化，例如将其专门用于聊天的ChatGPT，以使其具有良好的聊天功能，或者使用GPT-4并将其转变为专门用于自动完成代码的GitHub Copilot用例!说白了就是让模型拥有专业化能力。我们可以看到，未经过微调的模型和经过微调的模型，输出的效果差异巨大，因此，为了让我们的模型在我们的非通用领域上具有更好的表现性能，微调现有模型是非常重要且有效的做法，可以为我们提供较好的结果。

大模型原理与实践：第四章-大语言模型_第2部分-LLM预训练、监督微调、强化学习

10-06

1012

本文系统介绍了大语言模型(LLM)的三阶段训练过程：预训练(Pretrain)、监督微调(SFT)和人类反馈强化学习(RLHF)。重点分析了预训练阶段的因果语言建模任务、模型规模对比(从BERT到GPT-5的演变)、Scaling Law理论以及分布式训练技术。通过参数计算和资源需求分析，揭示了训练现代大模型所需的海量计算资源，包括数万张GPU和数月的训练时间。文章为理解大语言模型的核心训练原理提供了全面而深入的技术视角。

第11章面向分类任务的表示模型微调

04-25

7万+

在第四章中，我们使用了预训练模型对文本进行分类。我们直接使用了未经任何修改的预训练模型。这可能会让你产生疑问：如果我们对模型进行微调会发生什么？如果有充足的数据，微调通常能产生性能最佳的模型。在本章中，我们将探讨几种微调BERT模型的方法和应用：《监督式分类》展示了微调分类模型的通用流程；《少样本分类》将介绍SetFit方法——一种通过少量训练样本高效微调高性能模型的技术；《基于掩码语言建模的继续预训练》探讨了如何对预训练模型进行持续训练；《命名实体识别》研究了基于词元级别的分类任务。

【NLP】Datawhale-AI夏令营Day10打卡：微调ChatGLM2-6B

霍喜猫的博客

08-26

300

🚩【NLP】Datawhale-AI夏令营Day5打卡：预训练模型第五天继续尝试理解预训练模型相关知识，并跑通深度学习方法Topline。 🚩【NLP】Datawhale-AI夏令营Day6-7打卡：大模型 第六天和第七天学习了大模型的概念，大模型的训练步骤（大尺寸预训练+指令微调+RLHF），Prompt 的概念，以及大模型微调的概念。 🚩【NLP】Datawhale-AI夏令营Day8-10打卡：大模型基础Transformer 第八、第九和第十天复盘了大模型的基础，在精读论文的基础上理解T

North_D的博客

04-01

1464

Fine-tuning 是机器学习特别是深度学习中的一个重要概念和技术手段，主要应用于预训练模型的迁移学习过程。其基本原理是对已经在大规模通用数据集上预训练好的模型（如BERT、GPT系列、Transformer等），针对特定任务或领域数据进行微调。加载预训练模型：首先，获取已经在大规模无标注或有标注数据上训练得到的模型参数。保留部分或全部预训练权重：通常情况下，保留大部分层尤其是底层网络的权重不变，因为它们已经学习到了丰富的通用特征表示。修改输出层。

微调大模型（Finetuning Large Language Models）—Where finetuning fits in（二）

l8947943的博客

09-26

718

数据的准备是微调的基础，良好的数据质量是成功的一半，数据准备前置工作举足轻重。

【人工智能学习-AI-MIT公开课第 19. 架构：GPS、SOAR、包容架构】

最新发布

qq_22146161的博客

01-10

478

深度学习算法学习（四）：深度学习-最简单实现一个自行构造的找规律(机器学习)任务

qq_41894068的博客

01-07

422

规律：x是一个5维向量，如果第1个数>第5个数，则为正样本，反之为负样本。实现一个自行构造的找规律(机器学习)任务。基于pytorch框架编写模型训练。

学习笔记097——Ubuntu系统中如何通过service服务的方式启动 jar 包？

code__bee的博客

01-06

260

【代码】学习笔记097——Ubuntu系统中如何通过service服务的方式启动 jar 包？

Opencv 学习笔记：一文掌握四种经典图像滤波（均值 / 高斯 / 中值 / 双边）

saoys的博客

01-09

382

本文介绍了OpenCV中四种常用图像滤波方法的实现：均值滤波、高斯滤波、中值滤波和双边滤波。通过简洁的代码示例展示了每种滤波的具体调用方式，包括关键参数设置和注意事项。文章分析了不同滤波方法的特点和适用场景：均值/高斯滤波适用于基础去噪，中值滤波擅长处理椒盐噪声，双边滤波能保留边缘细节。特别强调了滤波核大小必须为奇数，并解释了各方法参数设置技巧。该指南为图像处理初学者提供了可直接复用的滤波实现方案。

MySQL初阶学习日记（8）--- JDBC

good_afternoon6的博客

01-05

1185

JDBC--java针对不同数据库上的API不同给出的一个解决方案JDBC本质上是Java标准库提供的一套类/方法，通过这组类/方法，把数据库C的原生API 进行封装，转换成Java版本的，同时也对不同数据库厂商的API进行了风格的统一安全‌：总是安全的，因为子类对象包含父类的所有属性和方法隐式‌：自动进行，无需显式转换操作符用途‌：实现多态性，通过父类引用调用子类方法风险‌：可能抛出，需确保对象实际类型匹配显式‌：需要使用 ( 子类类型 ) 父类引用语法。

【AI】AI学习笔记：OpenAI文件上传接口完全指南：从原理到实战入门、简单RAG实现

hknaruto的专栏

01-09

623

OpenAI的Files API是连接本地数据与云端AI服务的关键桥梁。目的决定格式：上传前明确purpose，它决定了文件格式和大小要求处理需要时间：上传≠立即可用，需等待异步处理完成状态机管理：始终检查文件状态（uploaded→processing→processederror清理不用的文件：定期删除不再需要的文件，避免额外费用无论是微调定制模型、为助手添加知识库，还是批量处理数据，Files API都是你AI应用开发工具箱中的重要组件。

以 JoyAgent-JDGenie 项目为例：如何利用 AI Agent 高效学习开源框架

caicongyang

01-05

1085

本文以JoyAgent-JDGenie项目为例，介绍利用AI技术高效学习开源框架的方法。

今天不写程序，学习简单记单词

weixin_66945505的博客

01-09

词源拆解法：inform（告知）+-action（名词后缀）=information。直接对应关系：field是英文术语，字段是中文翻译，两者在技术文档中可以互换使用。procedure：指一系列按顺序执行的步骤，用于完成特定任务。联想记忆：do....while在计算机中也是循环的意思。通过“告知”这个动作，自然联想到“情报”的传递性质。程序：中文里也指流程化的工作序列，强调步骤的有序性。

langchain1.x学习笔记（三）：langchain之init_chat_model的新用法

人工智能

01-10

134

本文介绍了在langchain1.x中使用init_chat_model函数的五种方式：1）直接构建模型并调用；2）后配置方式调用；3）流式输出；4）异步流式输出；5）结合提示词模板和管道使用。这些方法展示了如何灵活配置OpenAI模型参数，实现同步/异步调用、流式输出等功能，最后还演示了如何将模型集成到处理链中。

基于Fine-tune的神经网络模型训练与可视化实现

该资源不仅包含实际可运行的代码、数据集和脚本工具，还通过结构化的项目组织方式展现了从数据准备、模型训练、可视化分析到日志记录与自动化执行的全链条工程化实现，是AI大模型落地应用过程中非常典型且具有高度...

Day26下 - 大语言模型的 训练train 和 微调fine-tune 的区别

大语言模型学习的重点：

训练 train 和 微调 fine-tune 的区别

共同点：

训练：

微调：

三阶段：

第一阶段：预训练

Day26下 - 大语言模型的训练train 和微调fine-tune 的区别

训练 train 和微调 fine-tune 的区别