机器学习—交叉熵代价函数—极大似然估计推导

最新推荐文章于 2025-07-05 10:11:49 发布

原创最新推荐文章于 2025-07-05 10:11:49 发布 · 2.4k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#极大似然估计 #交叉熵代价函数 #逻辑回归代价函数

机器学习专栏收录该内容

40 篇文章

订阅专栏

本文深入探讨了逻辑回归模型及其背后的数学原理，通过极大似然估计推导出了交叉熵代价函数，揭示了逻辑回归如何通过Sigmoid函数预测样本属于正例的概率，并通过最大似然估计构建了逻辑回归的代价函数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、极大似然估计

首先得知道什么是极大似然估计

吴恩达老师在公开课直接给出交叉熵代价函数并简单解释了交叉熵代价函数作为逻辑回归代价函数的合理性，在周志华老师的《机器学习》教材中，从极大似然估计角度详细证明了交叉熵代价函数的推导。

二、逻辑回归模型

周志华老师从模型开始详细的介绍了逻辑回归的由来与其实质。
在这里插入图片描述
加入Sigmoid函数后得出

而在经过进一步的计算y=0和y=1时的概率

最终某样本属于正例的概率可以表示为

某样本属于负例的概率可以表示为

将w·x视为Sigmoid函数的输入，其中w是模型参数，x是特征向量，将Sigmoid函数的输出视为预测为正例的概率。

那模型将样本预测为正例的概率为sigmod(w·x)；将样本预测为负例概率为1- sigmod(w·x)。

三、极大化目标

极大化 => 将所有正例预测为正例的概率的累乘 * 将所有负例预测为负例的概率的累乘
在这里插入图片描述
而在计算机中通常求最小化问题，对上述公式运用对数法则对数似然并转换为求解最小化问题得出交叉熵代价函数：

四、使用极大似然估计构建逻辑回归代价函数另一种写法

在这里插入图片描述

五、最大似然估计和最小代价函数两种方式推导逻辑回归

大佬链接：
最大似然估计和最小代价函数两种方式推导逻辑回归

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。