LLM Minimind 项目训练流程和记录

原创

已于 2025-03-16 20:35:44 修改 · 1.2k 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#自然语言处理

于 2025-03-16 14:18:07 首次发布

前言

近日闲来无事，一直想着学习LLM、VLM和VLA的内容，把理论和实践走一遍，在最近把LLM和VLM/VLA的综述看完，索性操刀实践一波LLM和VLM的相关项目。这就是这篇LLM的实操记录的缘由。

项目介绍

Minimind 是一个目标在于以最小成本训练LLM的项目，其中包含两种尺寸的模型：0.025b模型和0.1b模型，包括模型的全生态训练：预训练、微调、人类反馈增强、Lora和 R1-zero，以及api部署。以下将对本项目进行实操和测试。

本人在autodl租用了一款32GB服务器，完成了对0.025b模型的训练（预训练、微调、人类反馈增强和 R1-zero）和api部署。模型的结构如下，隐藏层维度为512，transformer layer为8层。
模型结构
Tokenizer 采用 Minimind作者预训练的minimind-tokenizer，词表大小仅为6,400，以方便在性能预算不足的设备进行精度尚可的快速推理。以下是目前市面上较好的Tokenizer：

Tokenizer模型	大小	来源
yi tokenizer	64,000	01万物
qwen2 tokenizer	151,643	阿里云
glm tokenizer	151,329	智谱AI
mistral tokenizer	32,000	Mistral AI
llama3 tokenizer	128,000	Meta
minimind tokenizer	6,400	作者训练