多项式简化与对称函数多项式展开方法解析
1. 大型表达式简化方法
在处理大型多项式表达式简化时,传统的NMCS(Non-Monte Carlo Search)方法在面对变量众多的多项式时变得不可行。因为其评估函数成本高昂,即使是一级搜索也需要很长时间。
为了解决这个问题,我们将目光重新投向MCTS(Monte Carlo Tree Search),特别是UCT(Upper Confidence Bound applied to Trees)最佳子节点准则。在传统的UCT中,探索 - 利用常数$C_p$在整个搜索过程中保持不变,这导致在模拟后期仍会花费时间探索新分支,而此时可能没有足够时间到达最终节点。
为了改进这一问题,我们引入了一个新的动态探索 - 利用参数$T$,它随迭代次数线性减小:
$T(i) = C_p\frac{N - i}{N}$
其中,$i$是当前迭代次数,$N$是预设的最大迭代次数,$C_p$是$i = 0$时的初始探索 - 利用常数。
同时,我们修改了UCT公式:
$\text{argmax}_{children\ c\ of\ s} \bar{x}(c) + 2T(i)\sqrt{\frac{2 \ln n(s)}{n(c)}}$
这里,$c$是节点$s$的子节点,$\bar{x}(c)$是子节点$c$的平均得分,$n(c)$是节点$c$的访问次数,$T(i)$是上述动态探索 - 利用参数。
由于$T$的作用类似于模拟退火中的温度,在模拟开始时强调探索,后期逐渐转向利用,因此我们将这个新的UCT公式称为模拟退火UCT(Simulated Annealing UCT,SA - UC
超级会员免费看
订阅专栏 解锁全文
1392

被折叠的 条评论
为什么被折叠?



