12、博弈策略与逻辑研究

博弈策略与逻辑研究

1. 最优响应策略

在博弈中,策略规范表示满足特定属性的一组策略,因此需要重新定义策略比较和最优响应等概念。给定一个博弈 (G = (G, E)) 和玩家 (i) 的策略规范 (\pi),对于玩家 (i) 的一个规范何时比另一个“更好”,有以下两种定义:
- Better 1((\sigma, \sigma’)) :若存在 (F \in 2^R),存在 (\mu’) 满足 (\mu’ \models_i \sigma’),使得对于所有满足 (\tau \models_i \pi) 的 (\tau),(\rho_{\tau}^{\mu’}) 相对于 (E_i^F) 是获胜的,那么存在 (\mu) 满足 (\mu \models_i \sigma),使得对于所有满足 (\tau \models_i \pi) 的 (\tau),(\rho_{\tau}^{\mu}) 相对于 (E_i^F) 是获胜的。
- Better 2((\sigma, \sigma’)) :若存在 (F \in 2^R),使得对于所有满足 (\mu’ \models_i \sigma’) 的 (\mu’),对于所有满足 (\tau \models_i \pi) 的 (\tau),(\rho_{\tau}^{\mu’}) 相对于 (E_i^F) 是获胜的,那么对于所有满足 (\mu \models_i \sigma) 的 (\mu),对于所有满足 (\tau \models_i \pi) 的 (\tau),(\rho_{\tau}^{\mu}) 相对于 (E_i^F) 是获胜的。

为了算法化地比较策略,需要解决以下验证问

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值