某个参与者可以采取的所有策略组合形成了策略基因,参与者决策后形成态势。
混合策略:通过概率分布选择策略
纯策略:每次行动选择某个确定的策略
混合策略的随机性对应收益的期望值
例1 囚徒困境
乙背叛:甲背叛则-5,沉默则-10
乙沉默:甲背叛则0,沉默则-0.5。
因此,甲背叛是最佳选择,即严格占优策略
静态博弈:参与者同时决策,彼此不知道对方决策
动态博弈:有先有后,规则决定先后顺序,彼此知道采取的行动
完全信息博弈:参与者了解对方的策略集,收益等信息
不完全信息博弈:双方并不是都掌握了所有信息
囚徒困境是一种非合作、不完全的静态博弈
Nash定理:参与者有限,策略集有限,收益函数实值函数,博弈必定存在混合策略下的最优解
两人同时认罪就是这一问题的纳什平衡
例2 混合策略下的纳什均衡