非凸分布式优化中的Push - Sum算法解析
1. 分布式优化算法回顾
在分布式优化场景中,每个时间点 $t \in Z^+$ ,节点 $i$ 会维护向量变量 $z_i(t)$、$x_i(t)$、$w_i(t) \in R^d$ 以及标量变量 $y_i(t)$,且初始时 $y_i(0) = 1$ ($i \in [n]$)。这些变量的更新规则如下:
- $x_i(t + 1) = w_i(t + 1) - a(t + 1)f_i(z_i(t + 1))$ (式4.6)
根据该式,平均状态 $\bar{x}(t)$ 的动态变化为:
- $\bar{x}(t + 1) = \bar{x}(t) - a(t + 1)\frac{1}{n}\sum_{i = 1}^{n}f_i(z_i(t + 1))$ (式4.7)
可进一步改写为:
- $\bar{x}(t + 1) = \bar{x}(t) - a(t + 1)[f(\bar{x}(t)) + (\frac{1}{n}\sum_{i = 1}^{n}f_i(z_i(t + 1)) - f(\bar{x}(t)))]$ (式4.8)
其中,$f(z) = \frac{1}{n}\sum_{i = 1}^{n}f_i(z) = \frac{1}{n}\nabla F(z)$ 。若令 $q(t, \bar{x}(t)) = \frac{1}{n}\sum_{i = 1}^{n}f_i(z_i(t + 1)) - f(\bar{x}(t))$ ,则式4.8 成为式4.1 的确定性版本。
2. 收敛到临界点
为了研究算法的收敛性,需要对梯度函数 $f_i(x)$ 和目标函数 $
超级会员免费看
订阅专栏 解锁全文
91

被折叠的 条评论
为什么被折叠?



