21、博弈中的对抗搜索算法解析

最新推荐文章于 2025-08-23 10:35:05 发布

rust6ferris

最新推荐文章于 2025-08-23 10:35:05 发布

阅读量46

点赞数

CC 4.0 BY-SA版权

分类专栏：人工智能：现代方法精解文章标签：博弈对抗搜索极小极大算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/rust6ferris/article/details/151887200

人工智能：现代方法精解专栏收录该内容

99 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

博弈中的对抗搜索算法解析

1. 博弈中的最优决策基础

在博弈场景中，存在两个主要角色：MAX 和 MIN。MAX 期望找到一系列能导向胜利的行动，但 MIN 会进行干扰。这意味着 MAX 的策略需是一个条件计划，针对 MIN 的每种可能移动做出响应。

对于具有二元结果（胜或负）的博弈，可使用与或搜索来生成条件计划。而对于有多种结果得分的博弈，则需采用更通用的极小极大搜索（minimax search）算法。

以一个简单的两层博弈树为例（如图 6.2），在根节点，MAX 有 a1、a2、a3 三种可能的移动，MIN 针对 a1 有 b1、b2、b3 等可能的回应。此博弈在 MAX 和 MIN 各进行一次移动后结束。

博弈树中每个状态的极小极大值（MINIMAX(s)）可确定最优策略。极小极大值是指假设双方从该状态到游戏结束都进行最优玩法时，处于该状态对 MAX 的效用。终端状态的极小极大值就是其效用值。在非终端状态，轮到 MAX 移动时，MAX 倾向于移动到具有最大值的状态；轮到 MIN 移动时，MIN 倾向于选择使 MAX 值最小（即自身值最大）的状态。具体公式如下：
[
MINIMAX(s) =
\begin{cases}
UTILITY(s, MAX) & \text{if } IS - TERMINAL(s) \
\max_{a \in Actions(s)} MINIMAX(RESULT(s,a)) & \text{if } TO - MOVE(s) = MAX \
\min_{a \in Actions(s)} MINIMAX(RESULT(s,a)) & \text

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。