求助啊,李航的最大熵推导是怎么推的?

最新推荐文章于 2025-05-03 21:08:05 发布

原创最新推荐文章于 2025-05-03 21:08:05 发布 · 256 阅读

0 ·

CC 4.0 BY-SA版权

最大熵模型专栏收录该内容

1 篇文章

订阅专栏

本文深入探讨了机器学习中损失函数的构成与求导过程，详细解析了L(P,w)函数针对P(y|x)的求导步骤，尤其关注于特定条件下的偏导数计算，为理解复杂模型的优化提供了关键洞见。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

$L(P,w)≡−H(P)+w0(1−∑yP(y∣x))+∑i=1nwi(Ep‾(fi)−EP(fi))=∑x,yP~(x)P(y∣x)log⁡P(y∣x)+w0(1−∑yP(y∣x))+∑i=1nwi(∑x,yP~(x,y)fi(x,y)−∑x,yP~(x)P(y∣x)fi(x,y))\begin{aligned} L(P, w) & \equiv-H(P)+w_{0}\left(1-\sum_{y} P(y | x)\right)+\sum_{i=1}^{n} w_{i}\left(E_{\overline{p}}\left(f_{i}\right)-E_{P}\left(f_{i}\right)\right) \\=& {\color{red}\sum_{x, y} \tilde{P}(x) P(y | x) \log P(y | x) } +{\color{blue} w_{0}\left(1-\sum_{y} P(y | x)\right)} \\ &+\sum_{i=1}^{n} w_{i}\left(\sum_{x, y} \tilde{P}(x, y) f_{i}(x, y)-\sum_{x, y} \tilde{P}(x) P(y | x) f_{i}(x, y)\right) \end{aligned}$

$L (P, w)$ 对P(y|x)求导假如是对 $P(y_1|x_1)$ 求导,如下

$∂L(P,W)∂P(y1∣x1)=P~(x1)(logP(y1∣x1)+1)−w0+∑i=1nwi∑x,yP~(x)P(y∣x)fi(x,y)\frac{\partial L(P,W)}{\partial P(y_1|x_1)}={\color{red}\tilde {P}(x_1)(logP(y_1|x_1)+1)}{\color{blue}-w_0}+\sum_{i=1}^nw_i\sum_{x,y}\tilde P(x)P(y|x)f_i(x,y)$

其中红色部分是因为只有 $x=x_1,y=y_1$ 那一项才含有 $P(y_1|x_1)$

应用 $∑xP~(x)=1\sum_x\tilde P(x)=1$
$=P~(x1)(logP(y1∣x1)+1)+∑xP~(x)w0+∑x,yP~(x)∑i=1nwiP(y∣x)fi(x,y)=\tilde{P}(x_1)(logP(y_1|x_1)+1) +\sum_x\tilde P(x)w_0+\sum_{x,y}\tilde P(x)\sum_{i=1}^nw_iP(y|x)f_i(x,y)$