模拟退火简介及其在IO中的简单应用

本文深入探讨了模拟退火算法的原理与应用,通过对比水冷却过程,解释了如何逐步逼近最优解。介绍了算法的基本步骤,包括初始温度设定、退火比例及解的接受准则。并分析了算法性能受哪些因素影响,以及在实际应用中如何调整参数以优化结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(一)模拟退火简介:

我们先来考虑生活中的一个实际问题:

当你在烧一壶水,烧开以后想使其分别达到两种状态:①使水的温度迅速降低;②使水的能量最低;

对于第①种情况,显然我们直接将水迅速降温即可,但是对于这种迅速的降温确不能保证②。要使水的能量最低,我们需要对水进行徐徐地进行降温,使水在每个温度的能量都趋于稳定,才能使最终水的能量达到最低状态。(具体原因感兴趣的可以自行查阅)

而这里的“模拟退火”也是从这里引申过来的:

对于某些我们不能一步确定最优解的问题,我们可以模拟这种徐徐退火的方法慢慢地去逼近一个最优解。

举个最简单地栗子,比如我们需要求多个点的费马点(到所有点的距离之和最小的点),这个问题并没有上面确定性的算法(据我所知)。我们利用模拟退火可以得到如下的计算过程:

我们取某一点A(任取),假设得到的距离和为s1,做一个位移到B(得到的解为s2),,对于这次移动,如果移动后的解比原来的更优(s2<s1),那么我们继续从移动后的位置继续位移,寻找最优解。但是移动后找到的不是最优解呢(s1<s2)?如果直接舍弃的话,显然就有可能将正解给舍弃了,最终得到的只是局部最优。

这里我们有一个神奇的概率p=exp((s1-s2)/T)(Metropoils算法),我们以概率接受这个“更劣”的解(为了找到可能的全局最优解)。

这样的一种求解的方式就基本上是模拟退火的雏形了。

 

(二)算法步骤:

取一个起点A(得到初值s1),初始温度T(需要可以取到最优解),每次退火的比例(小于1且接近1的值delta)

while(T>eps){   

        A随机变化坐标得到B,变化幅度为 T 。   

        计算由B得到的解s2,得到两次解的差值D=s2-s1。   

        如果D<0(更优),就用B替换A(A=B)。   

        否则以 exp(-D/ T) 的概率用B替换A。   

        T=T*delta(即降温)

}

 

(三)性能分析:

模拟退火算法的正确性受到多个方面的影响,比如初始温度T,退火的速度(delta)等等。由于其中的一种随机的取“劣”的机制,求解过程就可能将最优解舍弃了,最终得到的解可能不是最优解。

但是对于实际的IO应用中,只要写得基本上标准的话一般还是不会有太大的问题(出题人良心的话2333)。并且做了几个题之后我发现我们并不用取那个更“劣”的解,也能得到最优解(这也是我为什么看别人代码的时候发现许多人都没有判断概率)。但是这可能仅限于我们的IO应用中,对于实际的工程项目中,这个判断还是必不可少的。

当我们WA了的时候通常可以尝试将退火速度减慢(增大delta)。

反之当我们TLE了的时候,我们可以加快退火的速度(减小delta)。

然而<比较大的delta>并不能保证比<比较小的delta>得到的解更优(?)。

就是感觉很玄学的算法。

 

(四)简单应用:

1、POJ-2420-A Star not a Tree?(求费马点):

                  题目链接&&解题报告

2、洛谷-P1337 [JSOI2004]平衡点 / 吊打XXX(类似于求费马点):

                  题目链接&&解题报告

3、Gym-101158J-Cover the Polygon with Your Disk(模拟退火+圆与多边形的交):

                  题目链接&&解题报告

 

(五)总结:

一直都不会写这些总结性的东西,这篇写得也可以说是很乱了,以后可能再改改吧。

写出来主要是对自己知识点掌握程度的自检(顺便刷一波访问量~(笑))。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值