大模型名称里的“3B”、“7B”、“70B”是啥？

原创

已于 2025-09-19 12:35:44 修改 · 2.2k 阅读

CC 4.0 BY-SA版权

文章标签：

于 2025-09-08 10:08:59 首次发布

是不是经常看到这样的新闻：“Meta发布新模型Llama 4 Scout，有 170 亿活跃参数”、“通义千问发布了Qwen3-235B大模型”、“深度求索（DeepSeek）发布的R1模型，参数也达到671B”？

这些“B”和“亿”到底是什么意思？是模型版本的代号？还是性能等级的划分？对我选择和使用AI有什么影响？

今天，我们就来彻底搞懂这个参数规模的秘密。你会发现，看懂这个数字，是你从“AI小白”迈向“AI玩家”的关键一步。

核心概念：这个“B”代表十亿（Billion）。3B就是30亿，7B就是70亿，14B就是140亿。
通俗比喻：
- 把它想象成模型的“脑细胞”或“神经元”数量。参数就是模型从数据中学到的所有知识和内部连接。
- 一个更恰当的比喻：它是一本超级字典的“词汇量”。30B参数的模型，它的“字典”里有300亿个知识点和关联规则；140B的模型则有1400亿个，理论上能表达更复杂、更细微的概念。
重要区分：这代表的不是版本号！ 不是数字越大版本越新。一个模型家族（如Llama、通义千问、DeepSeek）会同时发布不同规模的版本（7B, 13B, 70B），以适应不同的硬件和设备。数字大小代表模型的“体积”和“复杂度”。