博弈论策略分析与求解方法详解
1. 博弈论基础与优势原则
在博弈论中,为确定每个参与者的最佳策略,可运用优势原则对收益矩阵进行推导。以两家公司 A 和 B 为例,公司 A 有三种策略:提前 4 个月(A1)、提前 6 个月(A2)、提前 8 个月(A3)推出新产品;公司 B 也有三种策略:提前 1 个月(B1)、提前 3 个月(B2)、提前 5 个月(B3)推出新产品。收益矩阵如下:
| 公司 B \ 公司 A | 提前 1 个月(B1) | 提前 3 个月(B2) | 提前 5 个月(B3) |
| — | — | — | — |
| 提前 4 个月(A1) | 3 | 4 | 2 |
| 提前 6 个月(A2) | 2 | 3 | 1 |
| 提前 8 个月(A3) | 4 | -2 | -1 |
对于行参与者(公司 A),其目标是最大化收益。若第二种策略的收益值大于或至少等于第一种策略,则称第一种策略被第二种策略支配。比较 A1 和 A2,a11(3)大于 a21(2),a12(4)大于 a22(3),a13(2)大于 a23(1),所以 A1 是支配策略,A2 是被支配策略。
对于列参与者(公司 B),其目标是最小化损失。若第二种策略的收益值小于或至少等于第一种策略,则称第一种策略被第二种策略支配。比较 B1 和 B3,B3 是支配策略,因为 2 小于 3, -1 小于 4。经过多次比较和筛选,最终得出公司 B 会选择提前 5 个月(B3)推出新产品,公司 A 会选择提前 4 个月(A1)推出新产品,这一策略组合使公司 A 获得 2 个单位的收益,公司 B 损失 2 个单位,形成零和博弈。
此过程可总结