重读Alpha-Beta算法

本文详细解析了Alpha-Beta剪枝算法的工作原理及其在博弈树搜索中的应用。介绍了Alpha值与Beta值的概念,以及如何通过剪枝提高搜索效率。
Alpha值代表的是发起走棋一方(期望极大值)做能接受的最小值,搜索极大值一方必须要找到一个比Alpha值更大的,否则这步棋就没有任何意义
    Beta值代表的是对手(期望极小值)所能接受的最坏值,搜索极小值的一方必须找到一个比Beta值更小的一步棋,否则也是没意义的(因为有更好的一步棋已经生成了)

先看函数调用方式
int AlphaBeta(int depth, int alpha, int beta);

AlphaBeta(5, -INFINITE INFINITE);
这是发起走棋一方(搜索极大值的一方)调用的,因此设定为alpha为
-INFINITE;


这里假设是采用负极大值算法的

int AlphaBeta(int depth, int alpha, int beta)
{
   if(depth == 0 || IsGameOver()) return Evaluate(); //如果层数为0或者已达最终状态则返回本步棋的估值
   for(each possible move)
   {
     MakeMove();
    
     int val = -AlphaBeta(depth - 1, -beta, -alpha);
     UnMakeMove();
  
  if(val >= beta)
  {
    return val;
    //注意,这里需要返回val,因为上一层应该知道具体搜索到的值,以配合各种Alpha-Beta算法的变种
  }

     if(val > alpha)
  {
    alpha = val;
    ...
    //当然 这里还需要记录这步最佳的走法
  }
    
    
   }
   return alpha;//返回最好的值
}




首先假设是负极大算法,
Alpha值是父节点(非root)能搜索到的最大值,任何比他小的值都没意义。
Beta值是你所能找到的最坏的一种情况,任何比它大的都没意义。
{
  int val = -AlphaBeta(depth - 1, -beta, -alpha);
}
注意这个所谓的负极大的估值函数是估算本方的最优值,所以你的对手(子节点)估算出来的最优值如果大于你的-Beta
例如-beta == 3 子节点估值== 4,那么他实际上返回后(取负得-4)是小于你的Beta,所以它是有意义的。再看这个-alpha,
实际上是本层的beta是上一层节点(对手)的最大值的负值,如果任何本层节点取值,例如-alpha == 3,子节点估值为4,
4 >= 3,那么返回的是-4,-4< -3(alpha那个地方),所以无意义,因为在本层所有节点又都是越取越大(负极大),
所以本层也就没必要找了,直接剪枝了

btw: 我个人总感觉研究递归如果深入的去考虑stack frame是很愚蠢的,几乎越想越乱,几乎能疯了,呵呵
 
### TensorFlow与TPU-MLIR的关系 TensorFlow是一种广泛使用的机器学习框架,而TPU-MLIR是一个编译器基础设施项目,旨在简化不同硬件平台上的深度学习模型部署过程。两者之间的关系主要体现在通过TPU-MLIR可以优化并转换由TensorFlow训练好的模型到特定的TPU硬件平台上运行。 对于基于TensorFlow构建的应用程序来说,利用TPU-MLIR能够显著提高推理速度和降低延迟时间。这是因为TPU-MLIR引入了两个重要的Dialect来处理这一流程:一个是顶层张量操作(Tensor Operation, TOP) Dialect[^1];另一个则是底层针对具体TPU架构设计的Kernel Dialect[^1]。前者负责描述高层次抽象下的神经网络结构而不依赖任何特殊设备特性;后者则专注于生成适用于目标TPU芯片的有效指令集。 当涉及到将TensorFlow模型迁移到支持TPU加速环境时,通常会经历如下几个阶段: - **准备阶段**:创建一个新的工作目录`model_resnet50_tf`用于存放即将被转换或测试的数据文件以及配置脚本等资源[^2]。 - **转换阶段**:采用专门开发出来的工具链(如`tpu-mlir`),按照官方指南说明完成从原始`.pb`格式或其他形式保存下来的TensorFlow模型向中间表示(Intermediate Representation, IR),即MLIR格式的转变。 - **量化与部署阶段**:执行进一步的操作比如浮点数精度调整(`F32`)或是整数量化,并最终产出可以直接加载至指定型号处理器(BM1684为例)中的二进制模型文件(.bmodel)[^5]。 为了更好地理解整个过程中涉及的具体细节和技术要点,建议深入阅读相关技术文档,特别是关于如何编写自定义OPs、调试技巧等方面的内容。此外,在实际动手实践前还应该熟悉所选版本的API接口变化情况及其最佳实践案例分享。 ```bash # 创建新目录并与现有工程保持同一级别位置 mkdir model_resnet50_tf && cd $_ # 将待测图像复制进来以便后续验证效果好坏 cp /path/to/test_image.jpg . # 使用提供的Python脚本来启动转换任务 python3 path_to_script/model_deploy.py \ --mlir ./your_model_in_mlir_format.mlir \ --processor bm1684 \ --model output_bmodel_file_path.bmodel ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值