1、抓住关进内容进行理解。
2、 两个关键点:一个解的变换,怎么变换是个关键;一个是怎么找到更优的解;
(1)解的变换可以根据问题来进行,比如模拟退火大都会说道tsp问题,所以一个解代表着一条路径,变换的方式可以自己定义,如果解是0,1表示的,那么就可以用0,1变换的方式,或者是实数解,可以有一个扰动进行加减;
(2)怎么找到更优的解。当进行变化了以后,就可以得到新的解,然后进行比较,soluntion_new 比 soluntion_old更优的话,可以替代;但是,如果不是更优的话,那么可以按照一定的比例进行接收,这个时候是随机的方式接收这个新解;
3、怎么接收不是更好的解呢?随机的,用一个rand值 和 新解与旧解的差值与温度的比值进行比较,如果小于,那么就接收,大于就不接受。
这个公式中,温度t是变化的,随着时间的推移,t是减少的,那么p的概率值就会下降,而rand产生的值会大于p,也就是说 随着时间的推移,我一般就不会接收不是更优的解,只是一开始,我会接收,因为一开始可以给机会,后面就不给机会了。
4、 按照模拟退火的原理,就是一开始温度高,解 是活跃的,可以多多的接收,随着时间的推移,最要要进行淬火处理,温度是下降的,解 就不能太活跃了,基本趋于稳定状态了。
5、代码的细节:
(1)循环次数1,可以设置一个循环m,用于不同温度下的变换,寻找更优的解,每一次循环,都会在不同的温度下进行计算,这样代表的温度在下降,也就是退火的阶段;
(2)循环次数2,再设置一个循环n,用于同一个温度下,寻找更优的解;
(3)每次解的变换,怎么保存更优的解,是保存一个,还是几个呢?也就是用群体的方式,还是一个个体的方式。当然,现在模拟退火是个体的方式;