重读Alpha-Beta算法

最新推荐文章于 2025-02-16 11:31:55 发布

原创最新推荐文章于 2025-02-16 11:31:55 发布 · 3.2k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #each

算法专栏收录该内容

3 篇文章

订阅专栏

本文详细解析了Alpha-Beta剪枝算法的工作原理及其在博弈树搜索中的应用。介绍了Alpha值与Beta值的概念，以及如何通过剪枝提高搜索效率。

Alpha值代表的是发起走棋一方(期望极大值)做能接受的最小值,搜索极大值一方必须要找到一个比Alpha值更大的，否则这步棋就没有任何意义
    Beta值代表的是对手(期望极小值)所能接受的最坏值，搜索极小值的一方必须找到一个比Beta值更小的一步棋，否则也是没意义的（因为有更好的一步棋已经生成了)

先看函数调用方式
int AlphaBeta(int depth, int alpha, int beta);

AlphaBeta(5, -INFINITE INFINITE);
这是发起走棋一方（搜索极大值的一方）调用的，因此设定为alpha为
-INFINITE；

这里假设是采用负极大值算法的

int AlphaBeta(int depth, int alpha, int beta)
{
   if(depth == 0 || IsGameOver()) return Evaluate(); //如果层数为0或者已达最终状态则返回本步棋的估值
   for(each possible move)
   {
     MakeMove();

     int val = -AlphaBeta(depth - 1, -beta, -alpha);
     UnMakeMove();

  if(val >= beta)
  {
    return val;
    //注意，这里需要返回val，因为上一层应该知道具体搜索到的值，以配合各种Alpha-Beta算法的变种
  }
     if(val > alpha)
  {
    alpha = val;
    ...
    //当然这里还需要记录这步最佳的走法
  }


   }
   return alpha;//返回最好的值
}

首先假设是负极大算法，
Alpha值是父节点（非root)能搜索到的最大值，任何比他小的值都没意义。
Beta值是你所能找到的最坏的一种情况，任何比它大的都没意义。
{
  int val = -AlphaBeta(depth - 1, -beta, -alpha);
}
注意这个所谓的负极大的估值函数是估算本方的最优值，所以你的对手（子节点）估算出来的最优值如果大于你的-Beta
例如-beta == 3 子节点估值== 4，那么他实际上返回后（取负得-4)是小于你的Beta,所以它是有意义的。再看这个-alpha,
实际上是本层的beta是上一层节点（对手)的最大值的负值，如果任何本层节点取值,例如-alpha == 3,子节点估值为4,
4 >= 3，那么返回的是-4,-4< -3(alpha那个地方），所以无意义，因为在本层所有节点又都是越取越大（负极大），
所以本层也就没必要找了，直接剪枝了

btw: 我个人总感觉研究递归如果深入的去考虑stack frame是很愚蠢的，几乎越想越乱，几乎能疯了，呵呵