大模型训练中的 logits 是什么

大模型训练中的Logits解析

原创

已于 2025-08-30 16:52:03 修改 · 544 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#大模型 #logit

于 2025-08-30 16:50:12 首次发布

简述：大模型输出的原始得分。

Logits 在中文技术文献中通常直接使用英文术语，没有统一的中文译名。

在大模型训练中，Logits 可以理解为模型对每个预测结果的“原始打分”，它直接反映了模型对不同类别的“倾向性”，但尚未转换为概率。以下是通俗解释：

Logits 是什么？

直观理解

假设你问大模型：“明天会下雨吗？”模型可能会输出三个选项的原始分数：
- 下雨：2.5
- 不下雨：-1.0
- 阴天：0.3
  
  这些数值就是 Logits，它们表示模型对每个选项的“信心值”，数值越大代表模型越倾向于该结果。
技术定义

Logits 是模型最后一层神经网络的原始输出，未经过任何归一化处理（如 Softmax）。它的特点是：
- 可以是任意实数（正数、负数，甚至极大/极小值）。
- 不直接代表概率（总和不一定为1）。

Logits 的作用

训练阶段：指导模型学习
- 计算损失：模型通过 Logits 直接计算损失（如交叉熵损失）。例如，若正确答案是“下雨”，但模型对“下雨”打分为 2.5，对“不下雨”打分为 -1.0<

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

daxiang12092205 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。