国际象棋残局的性能分析与压缩技术探索
1. 不同决策深度下的性能表现
在国际象棋的研究中,我们通过实验来衡量不同决策深度下的错误率。实验评估了原始策略(raw policy)和使用强网络的 MCTS - 400。结果如图 1 所示,与原始策略不同,MCTS - 400 仅在较高决策深度时才会犯错。搜索能够完全纠正所有浅决策深度下的策略错误。在较高深度时,仍存在一些错误,但决策深度和错误率之间没有简单的关系。
| 决策深度 | 原始策略错误率 | MCTS - 400 错误率 |
|---|---|---|
| 浅深度 | 有错误,可被搜索纠正 | 基本无错误 |
| 高深度 | 有错误 | 有错误,无简单关系 |
同时,图 2 展示了每个决策深度下的样本大小与原始网络错误率之间的关系。在 KQkr 表库中,每个点对应特定决策深度的所有局面。其他四棋子表库的结果类似,给定深度下的局面越少,错误越多。MCTS - 400 的相关结果表明,该引擎仅在较高决策深度的局面中犯错。搜索通常可以解决浅决策深度的局面,而不受策略准确性的影响。
graph LR
A[决策深度] --> B[样本大小]
A --> C[错误率]
超级会员免费看
订阅专栏 解锁全文
1662

被折叠的 条评论
为什么被折叠?



