占优关系
弱占优与严格占优
定义:
- 对所有的z∈Θ,ui(yi,z−i)≥ui(xi,z−i)z \in\Theta,u_i(y_i,z_{-i})\ge u_i(x_i,z_{-i})z∈Θ,ui(yi,z−i)≥ui(xi,z−i),并且对于某些z∈Θz \in\Thetaz∈Θ,严格不等式成立,那么yi∈Δiy_i \in \Delta_iyi∈Δi弱占优xi∈Δix_i \in \Delta_ixi∈Δi
- 对所有的z∈Θ,ui(yi,z−i)>ui(xi,z−i)z \in\Theta,u_i(y_i,z_{-i}) > u_i(x_i,z_{-i})z∈Θ,ui(yi,z−i)>ui(xi,z−i),则有yi∈Δiy_i \in \Delta_iyi∈Δi严格占优xi∈Δix_i \in \Delta_ixi∈Δi
简言之,博弈方1采取混合策略x时,其收益不小于采取混合策略y时的收益,则称为策略x弱占优y;博弈方1采取混合策略x时,其收益大于采取混合策略y时的收益,则称为策略x严格占优y;
重复剔除严格占优
这是反复剔除严格被占优策略的过程,比如:
A=[300311]
A=\left[\begin {matrix}
3 & 0\\
0 & 3\\
1 &1
\end{matrix}
\right]
A=⎣⎡301031⎦⎤
x1=e13∈Δ1,y1=(12,12,0)∈Δ1x_1=e_1^3\in\Delta_1,y_1=(\frac{1}{2},\frac{1}{2},0)\in\Delta_1x1=e13∈Δ1,y1=(21,21,0)∈Δ1,计算u1(x1,z2)=1,u1(y1,z2)=12⋅x⋅3+12⋅3⋅(1−x)=32u_1(x_1,z_2)=1,u_1(y_1,z_2)=\frac{1}{2}\cdot x\cdot3+\frac{1}{2}\cdot3\cdot(1-x)=\frac{3}{2}u1(x1,z2)=1,u1(y1,z2)=21⋅x⋅3+21⋅3⋅(1−x)=23,那么对所有的z2∈Δ2z_2\in\Delta_2z2∈Δ2,有u1(x1,z2)<u2(y1,z2)u_1(x_1,z_2)<u_2(y_1,z_2)u1(x1,z2)<u2(y1,z2)
即可剔除策略3
严格占优可解
G=(I,S,π)G=(I,S,\pi)G=(I,S,π),令SD⊂SS^D\subset SSD⊂S为非重复剔除严格被占优策略纯策略组合的子集,若该集合为单点集合则称该博弈严格占优可解。
最优反应
纯策略最优反应
定义:βi(y)={h∈Si:ui(eih,y−i)≥ui(eik,y−i),∀k∈Si}\beta_i(y)=\{h\in S_i:u_i(e_i^h,y_{-i})\ge u_i(e_i^k,y_{-i}),\forall k\in S_i\}βi(y)={h∈Si:ui(eih,y−i)≥ui(eik,y−i),∀k∈Si}
意思就是:对其他博弈方的每个策略组合y∈Θy\in\Thetay∈Θ,博弈方i均可以找出一个收益最高的纯策略si∈S,sis_i\in S,s_isi∈S,si的集合即为博弈方i的纯策略最优反应对应β:Θ→Si\beta:\Theta\rightarrow S_iβ:Θ→Si
ui(xi,y−i)=Σk=1mi(eik,y−i)xik≤Σk=1mi(eih,y−i)xik=ui(eih,y−i)u_i(x_i,y_{-i})=\Sigma_{k=1}^{m_i}(e_i^k,y_{-i})x_{ik}\le \Sigma_{k=1}^{m_i}(e_i^h,y_{-i})x_{ik}=u_i(e_i^h,y_{-i})ui(xi,y−i)=Σk=1mi(eik,y−i)xik≤Σk=1mi(eih,y−i)xik=ui(eih,y−i)
即:针对某个混合策略y∈Δy\in \Deltay∈Δ博弈方i采取混合策略的收益小于纯策略最优反应带来的收益。
混合策略最优反应
混合策略xix_ixi带来的收益最高。将博弈方i的混合策略最优反应对应β~i:Θ→Δi\widetilde{\beta}_i:\Theta\rightarrow\Delta_iβi:Θ→Δi
β~i(y)={xi∈Δi:ui(xi,y−i)≥ui(zi,y−i),∀zi∈Δi}={xi∈Δi:xih=0,∀h∉βi(y)}={xi∈Δi:C(xi)⊂βi(y)}
\widetilde{\beta}_i(y)=\{x_i\in\Delta_i:u_i(x_i,y_{-i})\ge u_i(z_i,y_{-i}),\forall z_i\in\Delta_i\}\\
=\{x_i\in\Delta_i:x_{ih}=0,\forall h\notin\beta_i(y)\}\\
=\{x_i\in\Delta_i:C(x_i)\subset\beta_i(y)\}
βi(y)={xi∈Δi:ui(xi,y−i)≥ui(zi,y−i),∀zi∈Δi}={xi∈Δi:xih=0,∀h∈/βi(y)}={xi∈Δi:C(xi)⊂βi(y)}
β~i(y)\widetilde\beta_i(y)βi(y)为针对混合策略y的最优反应

图中也就是说,会有不同的混合策略对应着相同的最优反应。
组合混合策略最优反应对应β:Θ→Θ\beta:\Theta\rightarrow\Thetaβ:Θ→Θ 被定义为β~(y)=Xi∈Iβ~i(y)\widetilde{\beta}(y)=X_{i\in I}\widetilde{\beta}_i(y)β(y)=Xi∈Iβi(y)

也就是说,混合策略最优反应β~(y)\widetilde\beta(y)β(y)是包含各博弈方最优反应笛卡尔积的空间。
注:本文参考《演化博弈论》乔根·W·布威尔
2615

被折叠的 条评论
为什么被折叠?



