博弈论笔记

某个参与者可以采取的所有策略组合形成了策略基因,参与者决策后形成态势

混合策略:通过概率分布选择策略

纯策略:每次行动选择某个确定的策略

混合策略的随机性对应收益的期望值

例1 囚徒困境

乙背叛:甲背叛则-5,沉默则-10

乙沉默:甲背叛则0,沉默则-0.5。

因此,甲背叛是最佳选择,即严格占优策略

静态博弈:参与者同时决策,彼此不知道对方决策

动态博弈:有先有后,规则决定先后顺序,彼此知道采取的行动

完全信息博弈:参与者了解对方的策略集,收益等信息

不完全信息博弈:双方并不是都掌握了所有信息

囚徒困境是一种非合作、不完全的静态博弈

Nash定理:参与者有限,策略集有限,收益函数实值函数,博弈必定存在混合策略下的最优解

两人同时认罪就是这一问题的纳什平衡

例2 混合策略下的纳什均衡

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值