分布式随机Stackelberg策略与在线学习结合在安全博弈中的应用
1. 收敛速率优化
在安全博弈的资源分配问题中,考虑移动性约束下最大化收敛速率的问题可以表述为以下优化问题:
- 目标 :最大化 ( s )
- 变量 :( Q, K, s )
- 约束条件 :
1. ( K = D^ (Q - Q^T) + Q^T )
2. ( Kx^ = D^*Q1 )
3. ( Q_{ij} \geq 0 \quad \forall i \neq j, Q_{ii} = 0 \quad \forall i )
4. ( \sum_{i = 1}^{n} \sum_{j = 1}^{n} d_{ij}Q_{ij} \leq d )
5. ( \max_j { \min { Q_{ji}, Q_{ij} } } > 0 \quad \forall i )
6. ( P \left( \frac{K + K^T}{2} \right) P + sP \leq 0, s \geq 0 )
前四个约束条件来源于之前的相关设定。最后一个约束条件确保了矩阵 ( P(K + K^T)P ) 的负半定性,并最大化 ( |\lambda_1| ),具体由以下命题证明:
命题 5 :设 ( P(K + K^T)P ) 的特征值为 ( 0, \lambda_1, \ldots, \lambda_{n - 1} ),且 ( \lambda_1 \g
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



