【机器学习】交叉熵的推导

本文通过极大似然估计法和信息论的角度详细推导了交叉熵的概念,包括第一种方式利用似然函数和第二种方式从信息熵和相对熵出发。交叉熵在机器学习中用于衡量模型预测分布与真实分布之间的差距。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

作者:LogM

本文原载于 https://segmentfault.com/u/logm/articles ,不允许转载~

本文为旧博客文章,数学公式显示异常,请至 https://segmentfault.com/a/1190000019635885 查看。

1. 第一种方式

用极大似然估计法推导。

设:

$$\pi(x) = P(Y=1|x)$$

$$1-\pi(x) = P(Y=0|x)$$

所以,对于训练集 $T=\{(x_1,y_1), (x_2,y_2), ..., (x_N,y_N)\}$ 有似然函数:

$$\prod_{i=1}^{N}[\pi(x_i)]^{y_i}[1-\pi(x_i)]^{1-y_i}$$

化成对数形式:

$$L(w) = \sum_{i=1}^{N}[y_i log (\pi(x_i))+(1-y_i)log(1-\pi(x_i))]$$

就是我们熟悉的交叉熵。

2. 第二种方式

从信息论角度推导。

2.1 信息熵

一个事件 $x$ 发生的概率为 $p(x)$,其发生时携带的信息量为:

$$I(x) = -log(p(x))$$

我们把信息量的期望叫做"熵":

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值