交叉熵损失与极大似然估计

原创已于 2022-03-03 19:48:43 修改 · 1.3k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#交叉熵损失 #极大似然估计 #多分类 #多标签分类

于 2021-01-28 16:23:32 首次发布

深度学习同时被 2 个专栏收录

83 篇文章

订阅专栏

34 篇文章

订阅专栏

提升树Boosting Tree算法实例详解_程大海的博客-优快云博客

从提升树Boosting Tree过度到梯度提升Gradient Boosting_程大海的博客-优快云博客

GBDT梯度提升之回归算法个人理解_程大海的博客-优快云博客_梯度回归算法

GBDT梯度提升之二分类算法个人理解_程大海的博客-优快云博客_gbdt二分类

GBDT梯度提升之多分类算法个人理解_程大海的博客-优快云博客_gbdt可以多分类吗

XGBoost算法个人理解_程大海的博客-优快云博客_xgboost 叶子节点权重

交叉熵损失与极大似然估计_程大海的博客-优快云博客_极大似然估计和交叉熵

使用泰勒展开解释梯度下降方法参数更新过程_程大海的博客-优快云博客

AdaBoost算法实例详解_程大海的博客-优快云博客_adaboost算法实例

在训练分类模型时，通常使用交叉熵损失函数来定义模型的的预测概率与样本真实概率之间的差异。

二分类

1、二分类损失函数如下：

其中是样本的真实概率标签0或1，是Sigmoid函数的计算结果，是样本的预测概率：

是学习到的参数模型。

2、由极大似然估计推导出二分类损失函数：

计算参数使得取最大值。

对上式进行对数变换，将乘法转换为加法：

对上式取负号，将求最大值转换为求最小值，从而就可以用梯度下降等优化方法来求解。

这也就是上面提到的二分类损失函数。

多分类

1、多分类损失函数如下：

其中，是样本的真实概率标签0或1，是softmax函数的计算结果，softmax函数将学习到的多个线性模型转换为对应分类的概率，每个对应于一个分类类别，所以是样本被预测为第个分类的概率：

2、由极大似然估计推导出多分类损失函数：

计算参数使得取最大值。

对上式进行对数变换，将乘法转换为加法：

对上式取负号，将求最大值转换为求最小值，从而就可以用梯度下降等优化方法来求解。

这也就是上面提到的多分类损失函数。

多分类和多标签分类

多分类：一个样本只属于一个类别，可以直接使用softmax进行损失计算和训练模型

多标签分类：每个样本可能属于多个类别，softmax不适用于多标签分类，可以训练k(k为总类别数)个二分类模型，每次将一个类别作为正类，其余类别作为负类，训练一个二分类器，分别预测样本属于第k类别的结果，类似于One-vs-Rest训练方法。

参考：深入理解GBDT多分类算法

极大似然估计详解

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。