占优关系与最优反应

占优关系

弱占优与严格占优

定义:

  • 对所有的z∈Θ,ui(yi,z−i)≥ui(xi,z−i)z \in\Theta,u_i(y_i,z_{-i})\ge u_i(x_i,z_{-i})zΘ,ui(yi,zi)ui(xi,zi),并且对于某些z∈Θz \in\ThetazΘ,严格不等式成立,那么yi∈Δiy_i \in \Delta_iyiΔi弱占优xi∈Δix_i \in \Delta_ixiΔi
  • 对所有的z∈Θ,ui(yi,z−i)>ui(xi,z−i)z \in\Theta,u_i(y_i,z_{-i}) > u_i(x_i,z_{-i})zΘ,ui(yi,zi)>ui(xi,zi),则有yi∈Δiy_i \in \Delta_iyiΔi严格占优xi∈Δix_i \in \Delta_ixiΔi

简言之,博弈方1采取混合策略x时,其收益不小于采取混合策略y时的收益,则称为策略x弱占优y;博弈方1采取混合策略x时,其收益大于采取混合策略y时的收益,则称为策略x严格占优y;

重复剔除严格占优

这是反复剔除严格被占优策略的过程,比如:
A=[300311] A=\left[\begin {matrix} 3 & 0\\ 0 & 3\\ 1 &1 \end{matrix} \right] A=301031
x1=e13∈Δ1,y1=(12,12,0)∈Δ1x_1=e_1^3\in\Delta_1,y_1=(\frac{1}{2},\frac{1}{2},0)\in\Delta_1x1=e13Δ1,y1=(21,21,0)Δ1,计算u1(x1,z2)=1,u1(y1,z2)=12⋅x⋅3+12⋅3⋅(1−x)=32u_1(x_1,z_2)=1,u_1(y_1,z_2)=\frac{1}{2}\cdot x\cdot3+\frac{1}{2}\cdot3\cdot(1-x)=\frac{3}{2}u1(x1,z2)=1,u1(y1,z2)=21x3+213(1x)=23,那么对所有的z2∈Δ2z_2\in\Delta_2z2Δ2,有u1(x1,z2)<u2(y1,z2)u_1(x_1,z_2)<u_2(y_1,z_2)u1(x1,z2)<u2(y1,z2)
即可剔除策略3

严格占优可解

G=(I,S,π)G=(I,S,\pi)G=(I,S,π),令SD⊂SS^D\subset SSDS为非重复剔除严格被占优策略纯策略组合的子集,若该集合为单点集合则称该博弈严格占优可解。

最优反应

纯策略最优反应

定义βi(y)={h∈Si:ui(eih,y−i)≥ui(eik,y−i),∀k∈Si}\beta_i(y)=\{h\in S_i:u_i(e_i^h,y_{-i})\ge u_i(e_i^k,y_{-i}),\forall k\in S_i\}βi(y)={hSi:ui(eih,yi)ui(eik,yi),kSi}

意思就是:对其他博弈方的每个策略组合y∈Θy\in\ThetayΘ,博弈方i均可以找出一个收益最高的纯策略si∈S,sis_i\in S,s_isiS,si的集合即为博弈方i的纯策略最优反应对应β:Θ→Si\beta:\Theta\rightarrow S_iβ:ΘSi

ui(xi,y−i)=Σk=1mi(eik,y−i)xik≤Σk=1mi(eih,y−i)xik=ui(eih,y−i)u_i(x_i,y_{-i})=\Sigma_{k=1}^{m_i}(e_i^k,y_{-i})x_{ik}\le \Sigma_{k=1}^{m_i}(e_i^h,y_{-i})x_{ik}=u_i(e_i^h,y_{-i})ui(xi,yi)=Σk=1mi(eik,yi)xikΣk=1mi(eih,yi)xik=ui(eih,yi)

即:针对某个混合策略y∈Δy\in \DeltayΔ博弈方i采取混合策略的收益小于纯策略最优反应带来的收益。

混合策略最优反应

混合策略xix_ixi带来的收益最高。将博弈方i的混合策略最优反应对应β~i:Θ→Δi\widetilde{\beta}_i:\Theta\rightarrow\Delta_iβiΘΔi
β~i(y)={xi∈Δi:ui(xi,y−i)≥ui(zi,y−i),∀zi∈Δi}={xi∈Δi:xih=0,∀h∉βi(y)}={xi∈Δi:C(xi)⊂βi(y)} \widetilde{\beta}_i(y)=\{x_i\in\Delta_i:u_i(x_i,y_{-i})\ge u_i(z_i,y_{-i}),\forall z_i\in\Delta_i\}\\ =\{x_i\in\Delta_i:x_{ih}=0,\forall h\notin\beta_i(y)\}\\ =\{x_i\in\Delta_i:C(x_i)\subset\beta_i(y)\} βi(y)={xiΔi:ui(xi,yi)ui(zi,yi),ziΔi}={xiΔi:xih=0,h/βi(y)}={xiΔi:C(xi)βi(y)}
β~i(y)\widetilde\beta_i(y)βi(y)为针对混合策略y的最优反应
请添加图片描述
图中也就是说,会有不同的混合策略对应着相同的最优反应。

组合混合策略最优反应对应β:Θ→Θ\beta:\Theta\rightarrow\Thetaβ:ΘΘ 被定义为β~(y)=Xi∈Iβ~i(y)\widetilde{\beta}(y)=X_{i\in I}\widetilde{\beta}_i(y)β(y)=XiIβi(y)
请添加图片描述
也就是说,混合策略最优反应β~(y)\widetilde\beta(y)β(y)是包含各博弈方最优反应笛卡尔积的空间。
注:本文参考《演化博弈论》乔根·W·布威尔

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值