平均支付随机博弈与通信复杂度的直接积定理
平均支付随机博弈相关内容
在平均支付随机博弈领域,有许多重要的理论和算法值得探讨。
首先,对于一些博弈的性质和定理有诸多研究。例如,若已知所有节点的值,可通过求解遍历不同的博弈来得到一致最优策略。但直接使用这种归约方法时,遍历情形下的伪多项式算法通常不能直接用于求解整个博弈,原因在于归约过程中引入的自环局部奖励可能在节点数量上呈指数级小。
对于BW或BWR - 博弈,有以下重要的引理和推论:
- 引理4 :设(v)是BW - 博弈(G)中的节点,(x,y\in R)。存在不同情况,如当(\mu_{G(x)}(v) < x)时,对于任意(y\geq\mu_{G(x)}(v)),(\mu_{G(y)}(v)=\mu_{G(x)}(v))等四种情况。
- 推论2 :对于BW - 博弈(G)的任意节点(v),存在区间(I(v):=[\theta_l(v),\theta_u(v)]),使得在不同(x)取值范围下,(\mu_{G(x)}(v))有不同取值。
- 引理5 :对于BWR - 博弈(G),集合(I(G(x)) := {x\in R : G(x))是遍历的(})在(R)中形成一个闭区间(如果非空)。
- 引理6 :在BWR - 博弈(G)中,设(\theta_1\leq\theta_2)是(I(G(x)))中的两个实数,(s_W^ \in S_W)和(s_B^ \in S_B)分别是博弈(G(\theta_2))和(G(\theta_
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



