机器学习和深度学习中的logit

醒了就刷牙

于 2024-11-17 22:05:53 发布

阅读量1.3k

点赞数 15

CC 4.0 BY-SA版权

分类专栏：深度学习论文相关小知识点文章标签：机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/buyaotutou/article/details/143839347

系列博客目录

文章目录

系列博客目录
背景
模型假设
计算 logit
- 逐步计算：
解释 logit
从 logit 转为概率
- 进行逐步计算：
分类决策
总结

在图像分类任务中，“logit” 是指模型在输出层的未经过激活函数（如 Softmax 或 Sigmoid）处理的原始输出值。下面通过一个具体的例子来说明 logit 的概念，以及它如何用于图像分类任务。

背景

假设我们有一个简单的图像分类任务，目标是对输入图像进行 3 类分类（例如，类别 A、类别 B 和类别 C）。神经网络模型的最后一层是一个全连接层，它输出 3 个 logit 值（每个类别对应一个 logit）。

这些 logit 值通常被解释为“未归一化的分数”，用于衡量输入图像属于某个类别的可能性大小。

模型假设

输入图像特征：假设经过卷积网络处理后，我们得到了特征向量 $\mathbf{f} = [0.5, 0.8, 1.2]$ 。
最后一层权重和偏置：
- 权重矩阵 (W)：
  $\begin{bmatrix} 1.0 & -1.0 & 0.5 \\ 0.8 & 0.5 & -0.3 \\ -0.5 & 1.2 & 1.0 \end{bmatrix}$
- 偏置向量 (b = [0.2, -0.1, 0.5])。

计算 logit

logit 值通过以下公式计算：
$\mathbf{z} = W \cdot \mathbf{f} + b$
其中：

$\mathbf{z}$ 是 logit 值（模型的原始输出）。
$W$ 是权重矩阵。
$\mathbf{f}$ 是输入特征。
$b$ 是偏置。

逐步计算：

点积计算：
- 对类别 A：
  $z_1 = (1.0 \cdot 0.5) + (-1.0 \cdot 0.8) + (0.5 \cdot 1.2) = 0.5 - 0.8 + 0.6 = 0.3$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。