一文彻底搞懂大模型 - LLM的构建流程，零基础入门到精通，收藏这一篇就够了

最新推荐文章于 2025-09-25 15:48:23 发布

原创最新推荐文章于 2025-09-25 15:48:23 发布 · 2.1k 阅读

51 ·

CC 4.0 BY-SA版权

文章标签：

#学习 #web安全 #数据库 #网络 #安全架构 #python #java

网络安全同时被 3 个专栏收录

3201 篇文章

订阅专栏

程序员

3084 篇文章

订阅专栏

Python

749 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

LLM构建流程

大模型（LLM，Large Language Model）的构建流程，特别是OpenAI所使用的大语言模型GPT构建流程，主要包含四个阶段：预训练、有监督微调、奖励建模和强化学习**。这四个阶段各自需要不同规模的数据集、不同类型的算法，并会产出不同类型的模型，同时所需的资源也有显著差异。**

LLM构建流程

一、预训练（Pre-training）****

**什么是预训练？**预训练技术通过从大规模未标记数据中学习通用特征和先验知识，减少对标记数据的依赖，加速并优化在有限数据集上的模型训练。

目标：让模型学习语言的统计模式和语义信息。
数据集：利用海量的训练数据，这些数据可以来自互联网网页、维基百科、书籍、GitHub、论文、问答网站等，构建包含数千亿甚至数万亿单词的具有多样性的内容。
算法与资源：利用由数千块高性能GPU和高速网络组成的超级计算机，花费数十天甚至数月的时间完成深度神经网络参数的训练，构建基础模型（Foundation Model）。这一阶段对计算资源的需求极大，例如GPT-3的训练就使用了1000+的NVIDIA GPU，并花费了相当长的时间。
结果：基础模型能够对长文本进行建模，具备语言生成能力，根据输入的提示词，模型可以生成文本补全句子。

Pre-training

**为什么需要预训练？**预训练是为了让模型在见到特定任务数据之前，先通过学习大量通用数据来捕获广泛有用的特征，从而提升模型在目标任务上的表现和泛化能力。

Pre-training

预训练的技术原理是什么？预训练利用大量无标签或弱标签的数据，通过某种算法模型进行训练，得到一个初步具备通用知识或能力的模型******。**********

Pre-training

预训练是语言模型学习的初始阶段。在预训练期间，模型会接触大量未标记的文本数据，例如书籍、文章和网站。目标是捕获文本语料库中存在的底层模式、结构和语义知识。

Pre-training

二、有监督**微调（**Supervised Fine Tuning**）**

**什么是有监督微调？有监督微调（Supervised Fine-Tuning, SFT），**也被称为指令微调（Instruction Tuning）。在已经预训练好的模型基础上，通过使用有标注的特定任务数据对模型进行进一步的训练和调整，以提高模型在特定任务或领域上的性能。

目标：使模型具备完成特定任务（如问题回答、翻译、写作等）的能力。
数据集：使用少量高质量数据集，这些数据集包含用户输入的提示词和对应的理想输出结果。
算法：在基础模型的基础上进行有监督训练，使用与预训练阶段相同的语言模型训练算法。
资源：相比预训练阶段，有监督微调所需的计算资源较少，通常只需要数十块GPU，并在数天内完成训练。
结果：得到有监督微调模型（SFT模型），该模型具备初步的指令理解能力和上下文理解能力，能够完成开放领域问答、阅读理解、翻译、生成代码等任务。

Supervised Fine-tuning

为什么需要有监督微调？尽管预训练模型已经在大规模数据集上学到了丰富的通用特征和先验知识，但这些特征和知识可能并不完全适用于特定的目标任务。微调通过在新任务的少量标注数据上进一步训练预训练模型，使模型能够学习到与目标任务相关的特定特征和规律，从而更好地适应新任务。

**减少对新数据的需求：**可以利用预训练模型已经学到的知识，减少对新数据的需求，从而在小数据集上获得更好的性能。
**降低训练成本：**微调只需要调整预训练模型的部分参数，而不是从头开始训练整个模型，因此可以大大减少训练时间和所需的计算资源。

Supervised Fine-tuning

有监督微调的技术原理是什么？在预训练模型的基础上，针对特定任务或数据领域，通过在新任务的小规模标注数据集上进一步训练和******调整模型的部分或全部参数**************，使模型能够更好地适应新任务，提高在新任务上的性能。********

Supervised Fine-tuning

**********有监督微调如何分类？**SFT根据是否调整全部参数，可以细分为全面微调（Full Fine-tuning）和部分/参数高效微调（Parameter-Efficient Fine-tuning, PEFT）。

Supervised Fine-tuning

全面微调（Full Fine-tuning）

定义：在新任务上调整模型的全部参数，以使其完全适应新任务。
步骤：加载预训练模型 → 在新任务数据集上训练模型，调整所有参数。
应用：当新任务与预训练任务差异较大，或者想要充分利用新任务数据集时，可以选择全面微调。

部分/参数高效微调（PEFT）

**定义：**仅调整模型的部分参数，如添加一些可训练的适配器（adapters）、前缀（prefixes）或微调少量的参数，以保持模型大部分参数不变的同时，实现对新任务的适应。
**步骤：**加载预训练模型 → 在模型中添加可训练的组件或选择部分参数 → 在新任务数据集上训练这些组件或参数。
应用：当计算资源有限，或者想要快速适应新任务而不影响模型在其他任务上的性能时，PEFT是一个很好的选择。