8.33 未来发展趋势
尽管并行与分布式进化算法已经受到了大量学者的关注,而且大量有代表性的算法也被提出并用于求解一些实际问题。然而随着科学技术的发展,大数据时代的到来,一些新的挑战充斥着人们的生活,特别是一些高复杂度、大数据量、实时性优化问题变得越来越常见并迫切需要解决。本文从以下几个方面阐述并行与分布式进化算法的未来发展趋势。
并行与分布式进化算法处理实时性应用问题
随着云计算平台和高性能平台(比如连续蝉联世界超级计算机冠军的天河二号)的出现,大量的并行与分布式计算任务提交到平台系统。由于这些并行与分布式任务有着不同的资源需求以及不同的执行时间、先后顺序等需求,如何实时地给提交至系统的并行与分布式任务分配合理的计算资源,俨然成为提高系统平台资源利用率的关键点。另外,由于高性能平台需要大量能源消耗,再加上当前绿色计算的普及,如何根据提交至系统的计算任务实时地开 / 关系统平台物理机器,优化系统平台的能源消耗也成为当今绿色计算的关键研究课题。
再有,现实生活中也存在着其他实时性应用问题,比如出租车调度问题、车辆路由调度问题等。对于这类调度问题,实时性是求解该类问题的关键与难点。在这方面,并行与分布式计算进化算法有着独特优势,一方面,进化算法目前已经成为求解资源调度类问题的有效途径[29] ;另一方面,进化算法的并行与分布式执行方式可以提高算法的执行效率,大大降低算法的执行时间,为资源调度类任务的实时性提供保障。因此,可以看出并行与分布式进化算法有求解大规模实时性任务调度 / 资源调度的潜力。
并行与分布式进化算法处理大数据问题
大数据的到来给机器学习以及计算智能等领域带来了新的挑战。一方面,数据量的急剧增大,使得基于数学模型的机器学习算法优化难度急剧增加(导致数学模型非凸),同时使得机器学习模型对参数越来越敏感,因此如何高效优化机器学习模型成为了当前机器学习研究的热点之一;另一方面,大数据时代,每天都会产生大量的数据,而且以往数据和当前数据之间也有可能存在着较大的差异,因此,以往线下训练的机器学习模型很难适应当前数据,为此,训练好的机器学习模型需要根据当前数据不断演化,以适应最新数据。在这两方面,进化算法都有其得天独厚的优势,一方面,进化算法本身就是一种优化算法,不依赖数学模型的连续性、凸凹性等,可以直接对数学模型进行优化;另一方面,进化算法本身是一种演化算法,可以根据历史信息演化数学模型,从而使得数学模型能够适应当前数据。然而传统的串行式进化算法演化速度慢、耗时长,因此,为高效演化机器学习模型,并行与分布式进化算法是处理大规模数据优化的首选。
并行与分布式多目标进化算法
当前多目标优化,特别是超多目标优化(目标个数超过 3 个)已成为进化计算领域的一个研究热点。随着优化目标个数的增多,以往的多目标优化算法急剧失效。这是因为一方面,优化目标个数的增多使得所消耗的适应值评估次数大大增加,从而使得算法的执行时间大大加长;另一方面,优化目标的增多使得整个种群中非支配解的个数急剧增加,从而使得算法帕累托(Pareto)选择压力急剧减小,导致多目标算法收敛于局部的帕累托前沿(Pareto Front)。并行与分布式算法可以有效解决以上问题,一方面,并行与分布式算法可以将种群个体的每个优化目标函数的适应值计算分配到各个节点,大大加快了算法执行时间;另一方面,并行与分布式算法可以维持一个大种群,而后将大种群划分为小种群分配给各个节点维护,通过各个节点内的局部搜索,以及基于所有节点交互的全局通信,并行与分布式多目标 / 超多目标进化算法可以很好的平衡算法的探索和开发能力,从而使得算法能够很好地逼近优化问题的全局最优帕累托前沿。