分布式优化与博弈论学习中的随机方法
1. 积分号下求导的证明
在特定假设下,我们需要对表达式中的积分号下求导进行证明。考虑积分号下的函数 (U_i(x)(x_i - \theta_i)p_{\theta}(x)) 和 (\phi(x)(x_i - \theta_i)p_{\theta}(x)),在假设条件下,这些函数是连续的。接下来需要验证这些函数在整个 (R^N) 上的积分关于 (\theta_i \in R) 一致收敛。
通过对函数 (\phi) 在点 (\theta) 处进行泰勒展开:
[
\int_{R^N} \phi(x)(x_i - \theta_i)p_{\theta}(x)dx = \int_{R^N}(\phi(\theta) + (\nabla\phi(\tilde{\phi}(x, \theta)), x - \theta))(x_i - \theta_i)p_{\theta}(x)dx
]
[
= \int_{R^N}(\nabla\phi(\tilde{\phi}(x, \theta)), x - \theta)(x_i - \theta_i)p_{\theta}(x)dx
]
[
= \int_{R^N}(\nabla\phi(\tilde{\phi}(y, \theta)), y)y_ip(y)dy
]
其中 (\tilde{\phi}(x, \theta) = \theta + \alpha(x - \theta)),(\alpha \in (0, 1)),(y = x - \theta),(\tilde{\phi}(y, \theta) = \theta + \alp
超级会员免费看
订阅专栏 解锁全文
33

被折叠的 条评论
为什么被折叠?



