落子排序与免搜索博弈策略
1. 落子排序概述
落子的快速有效排序在博弈中至关重要。它可以独立应用于免搜索博弈程序,也能作为人类玩家的训练工具,更常作为复杂分析前的初步步骤。例如在α - β剪枝算法中,根据潜在优势对可能的落子进行初始排序,能为探索最有前景的路径节省时间。在竞技比赛中,由于时间限制,高效的落子预排序要么采用免搜索方式,要么进行浅层搜索,以便将更多时间用于深度、选择性搜索。
人类棋手在落子预选择方面展现出强大的直觉能力。例如,人类棋手每秒大约能粗略评估两个局面,而深蓝在相同时间内可验证2000亿个局面,这表明人类在初步落子选择上极为高效。
初始落子排序方法大致可分为三类:
- 基于历史表现的方法 :依据过往棋局中某落子的历史优势进行排序。
- 基于模式的方法 :依赖特定局面中是否存在特定的博弈模式。
- 基于预定义特征的方法 :考虑特定局面中预定义博弈特征的存在情况。
这三种方法都利用了博弈的专业知识,以相关模式、特征或对落子总体效用的启发式评估的形式呈现。基于模式的方法在围棋这类具有明显领地特征的博弈中尤为有用,因为棋子的布局在评估棋盘局面时起着主导作用。
此外,落子排序还可融入评估函数学习过程。一种做法是使用成本函数,对低排名落子被选为最佳落子之一时施加更高惩罚,从而使成本函数更倾向于选择高排名落子,忽略可忽略的落子。
2. 基于历史表现的方法
一些流行且通用的免搜索落子排序策略依赖于过往棋局中落子的历史优势,如历史启发式、杀手着法启发式、
超级会员免费看
订阅专栏 解锁全文
1125

被折叠的 条评论
为什么被折叠?



