智能电网中的计算智能方法-优快云博客

2

章节

智能电网环境中的计算智能

维拉·罗齐纳约娃，安娜·布·埃扎丁，马雷克·洛德勒，雅罗斯拉夫·勒布尔，罗贝尔特·马亚尔，佩特拉·夫拉布莱科娃
斯洛伐克布拉迪斯拉发技术大学信息学与信息技术学院，布拉迪斯拉发，斯洛伐克共和国

2.1 引言

长期以来，能源一直是极大地影响我们生活的因素之一。智能电网作为一种提供新技术的环境，也为电力供应领域的新概念设计带来了挑战。智能电网设备产生了大量的数据。然而，只有对这些数据进行深入处理，才能真正发挥其价值。

当前电网环境中出现了若干新现象：产生的数据为我们开发复杂的电力负荷需求预测模型提供了机会。从经济角度来看，电能现货价格是整个系统的一个重要方面。如今，能源不仅通过传统方式生产，还由分布式可再生能源提供。因此，消费者也可以转变为产消者。不久之后，电动汽车的大规模使用将到来，我们必须为这种类型的负荷做好电网准备。为了确保整个系统的有效运行，有必要找到其最优配置——这正是探索各种新型优化方法的应用场景。

智能电网环境非常复杂。它由许多需要通信和协作的组件构成，以确保电网稳定性和效率。此外，随着微电网、可再生能源和产消者的出现，相应的模型变得更加复杂，合作的需求也更加迫切。构建此类综合系统的适当架构是一项相当具有挑战性的任务。我们可以在图 2.1 中看到所包含组件的简化示意图。显然，除了需要解决的传统电力工程问题外，计算机科学领域还面临着众多任务和挑战。现代智能计算方法、云计算、大数据技术以及先进的数据科学可以帮助这一部分实现的愿景在世界许多社会中成为全面现实。

由于传统的数据处理方式已不再足够，迫切需要新的方法。在智能电表和其他新技术将被广泛使用的情况下，必须采用最近开发的大数据处理方法。如今，提供计算性能的趋势明显转向云环境——在设计电网生态系统时应考虑这一事实。云计算模型在多个方面具有优势——由于虚拟化的基础设施，它提供了可扩展性、弹性、按需访问和高效的数据存储。

示意图0

云分析可以使用多种部署模型——私有云、公共云或混合云[1]。私有云主要用于其提供的安全性和控制能力，而公共云则利用互联网技术向公众提供低成本服务。另一方面，混合云解决方案能够根据需要从公共云向私有云提供资源[2]。在任何用于大数据处理的基于云的解决方案中，数据管理、隐私和数据质量都是必须解决的技术问题。

来自传感器的结构化、半结构化和非结构化流数据的分析需求，以及对全部或大部分数据（而非数据样本）的处理，可通过大数据技术[3]解决。传统的大数据分析过程包括多种数据源的集成、数据管理（例如清洗、转换、聚合和过滤）、建模、结果分析和可视化[2]。对用户而言，最后一个阶段最为重要，因为需要通过可视化和结果分析来呈现从数据中获取的知识。

在建模阶段，采用数据挖掘过程，期间创建并评估模型。在此阶段，使用计算智能方法来完成特定任务，例如预测或优化。

来自智能电表的数据也表现出大数据的一些特征——测量数据从成千上万个不同地点以稳定的速度到达，因此可能具有无限的规模。到2020年，欧洲国家80%的电力消费者应配备智能电表。在全面推广后，预计每小时、每半小时或每15分钟都会有数十万甚至数百万条测量数据定期流入。此外，这些数据受动态环境影响很大——用电量取决于许多难以预测的变量，例如天气、消费者行为等。这种环境的动态性体现在增量或突变型变化（也称为概念）中

2.1 引言

由于节假日、夏季休假、社会活动、天气及其他相互关联因素导致的电力消耗变化（波动）。

电价也受到严重影响，因为它依赖于电力消耗。

海量数据的可获得性为采用和发展先进方法来解决智能电网和电力工程领域中出现的问题提供了新的机遇。在本章节中，我们重点关注以下三个问题：
• 准确的短期电力负荷预测以维持电网的平衡状态并最小化因不平衡引起的调节费用，
• 电价预测以支持电力市场交易中的议价决策，以及
• 电网优化以找到网络的最优运行模式，并最小化能源生产成本。

2.1.1 电力负荷预测

由于大规模储存电力的可能性非常有限，准确的预测对于电力调度和调控至关重要。准确的预测可确保可靠的电力分配，并将电网不平衡降至最低。电网不平衡构成了配电公司开支的重要部分。

还有其他一些重要的特征需要考虑——数据中明显的季节性和不规则性（也称为概念漂移），这些特征代表了电力负荷行为随时间的变化。

传统的时间序列预测方法，例如回归和时间序列分析，对目标变量（如电力需求）与一个或多个独立变量（如星期几、一天中的小时、温度）之间的依赖关系进行建模。

传统的时间序列预测方法能够很好地建模季节性依赖，但其对包含不同类型概念漂移的输入数据的适应能力有限。因此，它们不适合用于随时间变化的电力需求预测，需要采用增量学习算法。应对不同类型概念漂移的一种方法是使用集成模型。

集成模型通过应用多个模型来尝试创建最佳的估计。通常，集成模型由一组多样化的基础预测模型组成。每个基模型用于估计目标变量——回归任务中的一个实数。基模型的估计结果被组合起来以生成单一的集成估计。基估计的组合通常是通过对基估计进行加权和来实现的，但也可以应用其他加权方案或启发式方法来为估计分配适当的权重。集成模型的思想是，多个模型的组合有可能比单个（即使是增量）模型提供更准确的估计。

2.1.2 电价预测

电力在经济上不可储存[4]，并受到市场参与者之间围绕电价展开竞争所产生的供需力量的影响。基于智能电网中的需求侧管理，竞价策略的调整机会随之出现[5]。需求侧管理有助于鼓励电力消费者在高峰时段减少用电，而在非高峰时段增加用电[6]。

电价的行为具有多个特征，这些特征使得电价预测比电力负荷预测更具挑战性，例如更高的波动性、价格尖峰和季节性[7]。为了应对这些特定特征和解决方案的非线性，预测系统应包含更多来自智能电网的输入特征和更大的数据量。

在云计算上部署大数据技术可以解决这一问题，帮助智能电网的参与者专注于其核心业务。

云计算可提供基础设施、平台和软件即服务[2]，从而支持在大量数据上运行机器学习算法以进行预测分析。云计算通过为公司提供信息技术消费方式的不同选择，增强了灵活性[8]。通过在云上部署分析解决方案，客户可以按需付费模式[2]使用服务。云计算除了提供基础设施外，还提供多种商业模式，如分析即服务（AaaS）或大数据即服务（BDaaS）[8]。

在文献中发表的众多电价预测方法中，最显著的有多智能体模型、简约型模型、统计模型、基本模型以及计算智能模型[4]。统计模型和计算智能模型包含信号处理技术，因此在该研究领域中已被广泛确立[9]。我们对电价的研究集中在后者，因为统计方法在捕捉价格快速变化方面能力有限[10]。多种负荷预测技术也可应用于电价预测，特别是神经网络和支持向量回归[4]。

2.1.3 智能电网优化

另一类为确保电网平稳运行需要解决的问题，涉及对持续过程的优化需求，例如机组组合、经济调度和最优潮流[11]。根据建模的优化问题的复杂性，需要决定采用何种方法来求解该问题。

如果复杂性足够低，则可以使用精确方法（如分支定界算法或A*算法），这些方法能够保证解的最优性。然而，随着问题复杂性的增加，由于其计算复杂度较高，使用精确方法可能并不可行。在这种情况下，更适合采用近似算法（仍能提供性能保证）、问题特定启发式方法或元启发式算法。

元启发式算法属于一类算法，有助于解决具有多个维度（输入变量）的大规模问题的优化问题。它们不能保证返回精确最优解，但在大多数情况下，能在较合理的时间内提供较为理想的解[12]。元启发式算法是广泛且持续的研究兴趣的主题——在过去的6年（2010–2016年）中，发表了超过1,500篇包含metaheuristic关键词的论文。

随着智能电网技术的出现，元启发式算法已进入智能电网生命周期的几乎各个方面。微电网中组件的最优规模和数量对其正常运行至关重要，需要在规划阶段建设微电网之前确定。此问题被称为定容。机组组合和经济调度是在微电网运行期间需要反复执行的任务。通过引入可再生能源（如太阳能电池板或风力涡轮机）发电的不确定性，优化问题可能进一步复杂化[13]。

由于大数据的特性（大规模数据、通常处于高维空间且具有多个目标函数），用于寻找最优解的精确方法可能不可行。算法的运行时间可能过长，甚至可能无法使用（例如梯度）

2.2 相关工作与开放性问题

方法，因为许多优化函数可能是不可微的）。元启发式算法及其探索与开发机制可能为这一挑战提供有趣的解决方案。它们可以在相对较短的时间内搜索高维空间的大部分区域（在探索阶段），从而快速提供初步结果；如果有需要，还可以通过更长的运行时间进一步改进这些结果（开发阶段）。有关将数据挖掘任务建模为组合问题的更多信息，我们参考[14]，其中对该领域进行了充分的覆盖。

本章节的目的是介绍智能电网生态系统的模型，其中考虑了前述所有特征。我们的重点是基于大规模数据分析提出解决方案。这得益于智能网络中的新技术，使我们能够收集大量数据。

我们总结了多个项目的经验，并为这一主题提供了统一的视角。迄今为止，我们尚未发现有其他方法能够全面地提供如此广泛的服务。

本章节结构如下：第2.2节重点介绍电力负荷与价格预测及优化问题领域的相关工作。第2.3节概述了智能电网中使用的方法。下一节讨论智能网络预测与优化领域的提出方案。最后部分描述了结论与未来工作。

2.2 相关工作与开放问题

在本节中，我们概述了与我们关注的三个领域相关的现有研究——电力负荷预测、电价预测和智能电网优化。我们还提到了这些领域中普遍存在的当前问题。

2.2.1 电力负荷预测

根据预测时间范围，预测方法可分为短期、中期和长期。在电力工程中，这些分别指少于24小时、1天到1年和1–10年[15]。我们重点关注短期负荷预测，即未来24小时的预测，这对于维持电网平衡至关重要。

电力负荷预测作为一个领域，自电灯泡发明以来就已存在，因此出现了许多预测方法。这些方法通常分为统计方法（回归和时间序列分析）和人工智能（AI）方法[16]。混合方法构成一个独立的类别，结合了前两类方法。Hong[16]总结了这两类方法的优缺点。

统计方法的示例包括线性回归和时间序列分析方法，例如ARIMA[17]和指数平滑[18]。这些方法的优点在于具有坚实的理论基础，并且预测模型简单、稳健且可解释。然而，这些方法通常仅对输入变量与目标变量之间的线性关系进行建模。一般假设，在不考虑天气变量的情况下，线性模型足以满足短期预测需求（天气变量与电力需求之间的关系通常是非线性的）[16]。

最常用的人工智能方法是神经网络，但其他方法如专家系统、模糊逻辑、支持向量机也被加以利用。人工智能方法的优势在于其能力

2.2 相关工作与开放性问题

对输入与目标变量之间的非线性关系进行建模，并且对领域知识或统计学知识的要求较低。

据我们所知，目前仅有少量报告对多种电力负荷预测技术进行了比较。泰勒和麦克沙里[19]发表了一项针对短期预测的单变量统计方法的实证比较。其中，指数平滑（特别是其双重季节性变体）在ARIMA、指数平滑和基于主成分分析的方法中被证明是最精确的方法。在最近对负荷预测方法的比较中[20]，混合方法——双重季节性指数平滑与支持向量回归的集成模型——取得了最佳结果。

2.2.1.1 数据流预测

来自智能电表的测量数据持续到达，可被视为数据流。数据流的两个基本特性（以稳定速率传输的有序样本序列）——数据量和数据速度，决定了其处理方式。理想的数据流挖掘方法[21]：
• 每个数据流样本仅需很短的恒定时间；
• 使用固定数量的内存；
• 通过对数据一次扫描构建模型；
• 生成的模型具有与批量学习器几乎相同的准确性。

输入数据可以通过三种方式处理——离线、增量和在线[22]。离线方法处理内存中的所有历史数据。离线学习对应于批处理学习或传统数据挖掘。增量方法逐批次处理数据批次。通常，它们在数据流上保持一个滑动窗口，并使用部分内存来存储数据流的某些部分。在线方法逐个处理输入数据，并可在处理后立即遗忘该数据。

2.2.1.2 自适应性

数据流的第三个重要特性是变异性。它指的是随时间不断变化的数据以及影响数据的动态环境。

理想的预测方法也能够应对这种变化，即概念漂移。概念漂移被定义为输入数据特征的变化，或输入与目标变量之间关系的变化[22]。

存在不同的概念漂移模式，例如突变型、增量、渐变型和重现型。在电力需求中，突变型漂移可能是由于传感器被一个校准方式不同的新传感器替换所引起的。增量变化可能是由于传感器逐渐损坏并失去精度所致。渐变型变化表示两种状态（变化前后）同时存在。例如，家庭在引入新电价后逐渐改变其电力消耗习惯，从而导致电力需求的变化。重现型概念表示随时间重复发生但与季节性不同、不具有周期性的事件。因此，我们无法准确预知它们何时发生，例如节假日、体育赛事等期间的电力需求。采用合适的时间序列表示方法有望及时发现或预测各种漂移模式[23]。

漂移使得预测更具挑战性。因此，预测方法应能够尽快检测到概念漂移，并在需要时自适应地调整预测模型；区分漂移与噪声；并在少于流样本到达时间内完成操作，同时使用固定数量的内存。随时间改变预测模型的过程被称为adaptive

2.2 相关工作与开放性问题

学习，包括三个步骤——预测、诊断和更新[22]。在诊断步骤中，会计算损失估计（通常为预测值与实际值之间的差值）。通过监控这些损失，可以检测到数据的变化。然后，可以根据检测到的变化进行作为有根据的决策来执行该过程的更新步骤[22,24]。

文献中的自适应电力需求预测方法通常会盲目地适应持续变化的数据。最常用的方法是定期批量训练，即每当有新的数据批次到达时（例如每天/每小时/每15分钟），便从头开始构建预测模型。新模型使用现有数据并在末尾附加新的数据批次来构建。有时，为了加快训练过程，仅使用部分数据（即一个窗口），例如最近几天（相似的）数据，而不是所有可用数据。

另一种流行的方法是创建大量特定于上下文的模型，例如针对星期几、一天中的小时、节假日分别建立单独的模型。用于预测的模型将根据当前上下文进行选择。Dannecker等人[25]将天气、日历或经济变量等时间以外的因素也纳入了上下文中。创建了一个上下文‐模型对的存储库，以便在任何情况下搜索合适的模型参数，并选择最相似的上下文。

与定期批量训练类似，周期性模型部分更新通过定期更新其参数（全部或部分）或权重来确保预测模型的时效性，以最小化预测误差。为此目的，采用最小二乘法算法的变体[26]。另一方面，某些自适应模型被设计成其参数无需更新的形式。参数不是常数，而是被定义为函数，例如平滑转移指数平滑（STES）[27]。

通常，盲目自适应预测方法更为常见。它们尝试在从数据流中接收到每个新样本时更新预测模型。有指导的自适应预测方法则利用概念漂移检测器并监控预测模型的准确性，仅在出现漂移检测警报时才更新模型。这样可以降低过拟合的可能性，并节省计算和内存资源。研究表明，概念漂移检测器可以提高预测模型的准确性[28]。

2.2.2 智能电网中电力现货价格预测

近年来，现货价格预测的研究方向已转向大数据分析。大数据分析方法开始为电力市场现货价格预测带来略有不同的方法，我们已开始在特征选择过程中看到大量实验。大多数电价预测要么用于需求侧管理，要么作为企业的一种风险管理工具。需求侧管理有助于鼓励电力消费者在高峰时段减少用电，从而在非高峰时段增加用电[6]。公用事业公司或消费者将批发价格预测作为风险管理工具使用后，便产生了调整投标策略、电力生产或消费的机会[29]。

在多年的开发过程中，研究人员提出了多种电价预测方法。混合模型在此任务中变得非常流行，例如价格导向的智能电网中一种包含两个阶段的新混合模型[30]。在第一阶段，通过一组相关性支持向量机生成独立预测；在第二阶段，构建并使用多元线性回归集成模型进行点预测。一种结合ARMAX（带外部输入的自回归移动平均）模型的混合支持向量机被用于中期预测，预测周期从一个月到六个月，并且在集成支持向量机时表现出改进的结果

2.2 相关工作与开放性问题

向量技术与统计移动平均技术ARMAX[31]。建议将支持向量机与多种影响变量（如天然气、石油和负荷价格）相结合的优势进行集成[32]。采用混合混沌引力搜索算法对最小二乘支持向量机的参数进行优化[33]。使用特征选择技术——互信息，从一组输入中选择重要输入。

Abedinia等人提出了由一种新的随机搜索方法训练的组合神经网络[34]。神经网络训练通过改进版的化学反应优化算法实现。应用了一种结合神经网络和极限学习机的混合模型，用于点预测以及区间预测[35]。

王等人提出了一种新的电价预测框架[6]。该框架的提出动机在于，大多数现有的价格预测方法在特征选择过程中无法避免冗余，并且缺乏能够协调预测各步骤的集成框架[6]。作者设计了一个基于大数据分析的系统工具链，融合了灰色关联分析（GCA）和ReliefF两种冗余消除算法。为了实现降维，采用了核函数和主成分分析；为解决电价分类任务，提出了基于差分进化（DE）的支持向量机（SVM）。研究初期选择分类方法的原因是：消费者实际上更关心电价是否超过阈值，尽管作者也认识到点预测更为理想，但分类任务对准确性的要求较低，因此生成点预测更具挑战性[6]。系统框架包括特征选择、特征提取和支持向量机进化，最终生成输入数据的分类结果。研究人员使用了新英格兰独立系统运营商控制区（ISO NE‐CA）的数据，并将仿真结果分为特征选择、降维和分类三部分。在第一阶段，GCA和ReliefF消除了两个特征；在第二阶段，应用KPCA和PCA进行成分提取。结果表明，KPCA能够提供足够的主成分以保证预测的准确性[6]。在最后阶段，经过对SVM‐DE、朴素贝叶斯和决策树的比较，作者选择SVM‐DE作为性能最优的预测模型。整个系统仅产生了5%的误差。

一项以相关外生变量特征选择为重点的案例研究被提出[36]。所提出框架的动机是从企业存储的大量数据中提取知识，从而创造竞争优势。作者特别关注外生变量，其研究受到特征选择过程的显著影响。目标是主要利用天气数据来预测电力现货价格。该框架背后的基本思想是，由于越来越多的可再生电源向电力系统供电，电价将随之发生变动。与以往研究中将天气数据作为特征使用的主要偏差在于数据的聚合方式。作者未对天气数据进行聚合，而是单独使用各个气象站的数据。在特征选择方面，采用了最小绝对收缩与选择算子（LASSO）和随机森林算法。LASSO是一种带有正则化项的改进型普通最小二乘估计器，而随机森林是一种生成去相关决策树的集成方法，有助于解释输入数据[36]。基准模型采用了朴素方法和ARMAX模型。

实验中使用的外生变量包括来自欧洲电力交易所的德国和奥地利日前电价、风速以及温度数据。

模型系数通过滑动窗口的训练数据每日重新估计，并采用参数滚动重估方法。结果表明，以外生预测因子形式存在的天气数据显著提高了预测准确性[36]。一个重要发现是，引入外生

2.2 相关工作与开放性问题

包含了变量。需要采用滚动重估程序来改进最终预测，且汽车变量选择算法在平均平均误差方面表现更优。提出了一种数据驱动方法，用于分析风力发电对批发电价的影响[37]。作者强调了企业收集的大量数据中可能蕴含的价值。研究动机是建立一个能够表示风力发电定量效应的模型，从而为市场参与者提供有用信息。所使用的数据集来自阿尔伯塔电力系统运营商（AESO， https://www.aeso.ca）的公开数据。目标是评估每兆瓦时风力发电对电价的影响[37]。提出了七步法，从数据准备开始，经过特征选择、模型构建、异常检测、聚类、相似性检测，最后进行价格影响评估。通过互信息（MI）和基于相关性的特征选择（CFS）进行数据准备和特征选择，以创建有影响力的输入变量子集，降低维度并去除冗余信息。由于需要找到目标变量的条件期望，因此采用稳健局部加权回归（RLWR）非参数模型进行预测建模[37]。异常检测算法用于消除不符合检测模式的实例。使用k均值聚类方法检测不同的运行状态，该方法接收输入参数 k并将 N个实例划分为 k个聚类[37]。在最后两个阶段——相似性检测和价格影响评估中回答了一个重要问题：“所选特征的变化如何影响目标值？”最终结果表明，负荷和风电水平是提高电力现货价格预测精度的重要输入变量，风力发电每增加100兆瓦时，电价将根据运行状态的不同降低0.83至1.72美元[37]。

在电价预测中，存在若干尚未解决的问题。必须从影响电价发展的基本因素集合中选择一个子集。一个未解决的问题是：当某些基本因素的影响仅在特定时间间隔内显现时，什么是最优子集？另一个开放性问题是处理电价尖峰。对于作为电价重要特征之一的尖峰预测，何种方法是最合适且通用的？尖峰识别是该问题的另一章节，不同的方法可能产生根本不同的结果。

在该领域的研究过程中需要做出诸多决策，因此模型评估也可能成为难题。这一问题与数据及数据区间选择、数据准备及其他决策密切相关。

2.2.3 大数据与微电网中的优化与元启发式

我们可以看到，诸如粒子群优化（PSO）、人工蜂群（ABC）或遗传算法（GA）等优化算法在智能电网和微电网领域也得到了广泛应用。

粒子群优化在数据挖掘任务中的应用非常广泛，例如使用粒子群优化从数据流中进行特征选择[38]、垃圾邮件过滤[39]、或支持向量机的参数确定[40]。近年来，粒子群优化在聚类方面的应用也十分显著，关于文献的广泛综述，我们推荐读者参考[41]和[42]。

许多研究探讨了使用粒子群优化的经济调度问题，例如采用差分版本的粒子群优化[43]，其在含有可再生能源的微电网中的应用[44]，以及在关注智能储能的微电网中的应用[45]。二进制粒子群优化被用于机组组合[46]。电池最优容量配置也是一个通过粒子群优化解决的问题[47]。

2.3 智能电网问题中使用方法的概述

采用多时段变化的ABC算法对孤岛微电网进行经济调度[48]。与传统能源管理系统相比，所得方案显示出约30%的成本降低。ABC算法还被用于微电网组件（光伏板、风力涡轮机、储能系统）的定容优化[49]。目标是最大化净现值（NPC），该指标用于判断微电网的使用是否带来净收益或损失。结果显示利润约为€38,000。一种改进版ABC算法利用引力搜索来增强侦察蜂角色的能力[50]。该改进算法用于优化多目标函数，该函数基于负荷需求，包含燃料成本最小化、排放因子以及运行和维护成本的最小化。

一种改进的人工蜂群算法（ABC）与Hadoop和MapReduce技术结合使用，能够有效处理高维问题[51]。然而，由于MapReduce Hadoop架构带来的计算和通信开销，该方法并不适用于小规模优化问题。另一种用于多目标优化的ABC算法改进被应用于关联规则挖掘[52]。

所提出的方法在公开可用数据集上进行了评估，并与NSGA‐II、MOPSO和Apriori算法进行了性能比较，结果表明该改进的ABC算法优于这些对比算法。

遗传算法（GA）的一个有趣应用是将其用于配送网络[53]中的产品配送优化。通过关联规则挖掘来预测产品将在何处销售，然后利用遗传算法优化多个因素，如运输成本、行驶时间和所用关联规则的置信度。

最优容量配置和机组组合问题被表述为领导者‐跟随者问题（双层优化问题），因为组件的最优定容还取决于所采用的能源管理策略[54]。因此，定容作为领导者问题通过遗传算法求解，而跟随者问题即机组组合则通过基于混合整数线性规划的求解器求解。该方法在五个场景中进行了测试，与基于规则的策略参考案例相比，实现了显著的总成本降低。

基于粗糙集理论的并行遗传算法（PGA）在Hadoop MapReduce中的实现有助于特征选择[55]。PGA应用于规约阶段，其中每个规约器从映射器收集区分表并执行其遗传算子。染色体中的基因表示对应属性是否被选中（1表示选中，0表示未选中），染色体适应度计算为区分能力，并根据所选属性数量进行惩罚（所选属性越多，适应度越差）。最优个体由驱动器选出。

实验在4个公开可用数据集上进行，结果显示运行时间显著减少，并具有良好的可扩展性——在维度增加时仍保持一致的结果。

在智能电网和微电网领域，超启发式算法的应用呈现出稳定增长的态势，但相关可用文献有限。超启发式算法已成功用于为电池制定最优放电计划[56]。其中，低层启发式方法被定义为规则，用于决定电池容量的放电比例。随后采用进化算法来演化出最优的放电计划（即启发式序列）。该最优放电计划有助于在微电网中更好地利用电池，从而实现了从公用电网获取的能源减少5.73%。

超启发式算法也用于需求侧管理中的调度问题，以安排充电 of插电式电动汽车 (PEV)，被表述为一个多目标优化问题 b-

2.3 智能电网问题中使用方法的概述

问题[57]。采用了一种名为基于禁忌搜索的轮盘赌超启发式算法的超启发式算法[58]。通过优化插电式电动汽车的充电规划，实现了成本和排放减少。

如上所述，目前在智能电网和微电网任务中采用超启发式算法的研究尚不多，但少数现有研究已展现出 promising results。因此，我们认为这一尚未充分探索的超启发式算法应用领域具有吸引力，并且相比现有方法具有巨大的改进潜力。

在我们的研究中，我们探讨了上述三个领域——电力负荷预测、电价现货预测以及智能电网优化。这些任务的输出密切相关，对于智能电网环境中的能源管理至关重要。这些领域所使用的方法也相互关联——相同的计算智能方法可用于解决所有这些领域的任务。在下一节中，我们基于文献综述对预测与优化中最常用的方法进行了概述，并详细描述了我们深入研究并进行实验的方法。

2.3.1 预测方法

在文献中，存在多种分类方案，用于对短期负荷预测方法[15,59,60]进行分组。这些分类方案基于多个方面，如预测时间范围、预测方法的相似性、计算复杂度、适应数据变化的能力等。在本研究中，我们采用 Srivastava 等人[60]提出的最新分类方案，该方案将预测技术分为统计技术、人工智能（AI）技术和混合技术。这些主要类别随后被进一步细分为更具体的小子类别。

2.3.1.1 统计技术

用于电力负荷和能源价格预测的统计技术提供了因变量（负荷或价格）与一个或多个独立变量（各种输入因素，如天气、社会活动、股票信息等）之间关系的明确数学模型。

回归模型。 这些模型用于估计一个或多个解释性输入变量与因输出变量之间的线性关系。回归的目标是通过将模型拟合到观测数据并最小化误差平方和[61]，找到最优线性方程。根据解释变量的数量，回归分为两种类型：简单线性回归和多元线性回归。实际问题很少只涉及一个解释变量，且通常具有线性性质。在回归模型中，预测结果由一个或多个选定的解释变量以及先前计算出的回归系数得出。在电力工程领域，解释变量可以是电价、电力负荷、天气等。

通过LOESS进行时间序列的季节性分解。 时间序列分析中使用的基本方法之一是将时间序列分解为多个组成部分——趋势、季节性和残差。分离出的各个成分可以更简单地解释时间序列的行为，也更容易进行预测。通过LOESS（STL）[62]利用局部回归（LOESS）对原始时间序列进行平滑处理，以识别季节性成分。其余部分经过平滑处理后得到趋势成分。残差代表季节性加趋势拟合后的残差部分。这三个生成的时间序列可以分别使用任意预测方法进行预测，例如指数平滑或Box‐Jenkins模型。

指数平滑。 该预测方法相对简单但稳健[18]。它将时间序列的未来值预测为过去观测值的加权平均，且随着观测值时间变老，其权重呈指数函数衰减。其基本思想是，在预测中较早的观测值被赋予较小的权重，而近期的观测值则被赋予较大的权重。指数平滑使用一个或多个平滑参数来计算观测值的权重。根据所平滑的时间序列成分的数量和类型，指数平滑有多种变体，例如简单（水平）、霍尔特法（水平、趋势）、霍尔特‐温特斯法（水平、趋势、季节性）等。此外，根据季节性的类型不同，又可分为加法型和乘法型两种形式。电力负荷消耗数据通常表现出水平、趋势以及双重季节性（日周期和周周期）。双季节性霍尔特‐温特斯指数平滑（DSHW）[63]已被证明是电力负荷预测中非常成功的方法。霍尔特‐温特斯指数平滑也广泛应用于其他能源相关领域，例如光伏发电量预测[64]。

博克斯-詹金斯模型。 博克斯‐詹金斯模型可能是时间序列预测中最广泛使用的模型。这些模型假设数据具有内部结构，例如趋势、季节性变化和自相关[17]。它们还假设时间序列的连续观测值是由过去的数值和一个随机噪声过程线性生成的。它们通常由自回归分量（AR）和移动平均分量（MA）组成。AR模型涉及对同一时间序列的前期值进行回归。MA模型涉及将误差项建模为预测误差前期值的线性组合。这些方法的输入是随机时间序列，分为两类——平稳或非平稳。平稳时间序列由AR和ARMA建模。非平稳序列由ARIMA建模。它包含一个额外的差分部分（I），通过一次或多次应用差分步骤来消除非平稳性。为了能够对时间序列的季节性成分进行建模，应使用博克斯‐詹金斯模型的季节性扩展——SARIMA模型。许多时间序列受到外生变量的影响。例如，在负荷预测中，气象变量（如温度、湿度或日照）以及日历变量（如日期类型、一天中的小时或一年中的月份）可能与负荷时间序列高度相关。能够将这些变量纳入模型的博克斯‐詹金斯模型称为ARIMAX模型。

自回归移动平均模型和ARIMA模型被用于预测电力消耗[65,66]，预测可再生资源发电的风速[67,68]，预测未来太阳能板发电量[69]，或用于电价预测[70,71]。

2.3.1.2 人工智能技术

基于人工智能（AI）的模型模仿人类的学习和问题解决功能。它们用于预测由解释性输入变量定义的输出变量，或对参数进行优化。如今，基于人工智能的模型被广泛应用于解决许多现实生活中的问题[72–74]。在电力工程领域，人工智能模型主要用于负荷与价格预测以及多个微电网变量的优化，例如经济调度、机组组合、微电网定容[75,76]。

支持向量回归（SVR）。 它是一种基于弗拉基米尔·瓦普尼克的支持向量概念的监督学习技术。支持向量方法是一种用于解决多维函数估计问题的智能方法，最初是为模式识别而设计的[77]。支持向量的概念主要应用于三类问题，即分类、聚类和回归问题的求解[31,32,78]。

支持向量回归直接源自统计学习理论[79]。支持向量是训练数据中的一个较小子集，被用于寻找具有良好泛化能力的决策规则[77]。通过引入损失函数，原始的支持向量机方法可以转化为求解回归问题的方法[79]。其目标是找到一个函数逼近输出，使得逼近值与实际目标之间的偏差小于ε[80]。

我们给定训练数据 {(xi, yi),…,(x, y)} ⊂ X ∈ R。该函数的形式为（2.1）。
f(x)= 〈w, x〉+ b w ∈ X, b ∈ R (2.1)
在此函数中，w 表示权重向量，x 是输入向量，b 代表偏置[80]。

目的是求解一个约束二次问题，其中最小化的凸目标函数由损失函数与正则化项（权重的范数）组合而成[81]。基本思想是最大化支持向量之间的间隔。通过最小化 ‖w‖2 来获得函数的平坦性。该问题可以表述为一个凸优化问题，其中参数 C决定了平坦性与对偏差容忍度之间的权衡 ε（2.2）[80]。

minimize 1 2‖ w‖2+ C
∑
i=1 (ξi+ ξ ∗ i)
subject to ⎧⎪⎨⎪⎩yi −〈w, xi〉 − b ≤ε+ ξi 〈w, xi〉+ b − yi ≤ε+ ξ ∗
ξi, ξ ∗
i ≥ 0
(2.2)

关键思想是通过引入对偶变量集，利用目标函数和相应的约束条件构造一个拉格朗日函数。可以证明，该函数在解[80]处关于原变量与对偶变量存在一个鞍点。

通过求解对偶优化问题，部分解可以重写为（2.3）。
f(x)=
∑
i=1
(αi −α
∗ i)〈xi, x〉+ b (2.3)

变换后的方程称为支持向量展开，它描述了输入的线性组合 xi[80]。在图 2.2 中，我们可以看到由线性SVR创建的输入点近似，该方法使用了 ε‐不敏感损失函数。

示意图1

非线性解通过使用核函数实现[81]。目标是将训练数据映射到高维空间，以便找到线性解[79]。核函数能够高效地在原始输入空间中计算高维空间的内积，并克服维度问题[82]。然而，计算仍然严重依赖于训练模式的数量，且为高维问题提供良好的数据分布通常需要较大的训练集[82]。输入空间中的核函数相当于特征空间中的内积，其定义如(2.4)所示。
K(x, x′)= 〈(x)·(x′)〉 (2.4)

核函数表示特征空间中的内积，如果该核函数是对称正定函数且满足Mercer条件[82]。在实际解决方案中，通常使用多项式、高斯径向基、指数函数、线性和Sigmoid核函数[79]。对于非线性问题，选择合适的核函数会极大地影响最终解的误差。

人工神经网络（ANN）。 一种计算智能方法，它抽象地表示生物系统中的神经元及其操作[83]。神经网络是数据驱动的非线性非参数模型，适用于解决复杂问题[84]。使用人工神经网络的优势在于其能够逼近非线性函数，具备异步并行与分布式处理、自组织以及通过学习过程适应环境的能力[85]。目前，人工神经网络已广泛应用于分类、聚类和预测问题，并在许多学科中被广泛接受，用于建模现实世界的问题[86–88]。通常情况下，神经网络是一种黑箱方法。检查网络结构无助于理解问题本身以及网络为何以某种方式建模。人工神经网络的基本思想是模拟人脑，其中神经元相互连接，并从其他神经元接收输入信号，通过激活函数处理信息[89]。一个神经元的输出即为另一个神经元的输入。人工神经网络包含一个输入层、一个输出层以及零个或多个隐藏层。这些层上的神经元相互连接。

感知机是一种仅有一个输入层和一个输出层的神经元，可以表示为（2.5）[90]。
y={1 if ∑ n i=1 w i x i ≥ b,
0 if ∑ n i=1 w i x i < b, (2.5)

一个向量 w由连接权重组成，x是输入向量，y是输出向量，而 b是偏置。这种简单的神经网络可以解决线性分类问题。学习过程隐藏在权重中，因此必须采用适当的优化技术以获得最优解。大多数实际问题是非线性的，在这种情况下需要两个以上的层（输入层和输出层）。

在电力预测中，前馈网络和循环网络最为流行[4]。前馈网络是一种人工神经网络，其中信息从输入层经过隐藏层流向输出层。多层感知机（MLP）神经网络表示为（2.6），
y= φ( n ∑
i=1 wixi −θ) (2.6)

其中是阈值，φ是可微函数。训练过程从将训练集输入到输入节点开始，接着对第一隐含层中输入节点的激活值进行加权和累加[91]。权重之和随后通过激活函数进行转换，生成其他层的输入。训练过程在每次迭代（训练周期）后生成数值。每次训练（权重修改）后计算出的误差由优化算法最小化，其目标是寻找全局最小值，从而找到最优的输入参数集合。

误差传播的方法称为反向传播。反向传播人工神经网络将误差从输出层向隐藏层并返回到输入层进行反向传播。通常，反向传播人工神经网络工作分为两个阶段：前向传播阶段产生一个解，反向传播阶段则修改权重，而这些权重最初是随机选择的。Recurrent neural networks是一类网络，其中神经元的输出可以反馈给同一层或前一层的神经元[90]。循环神经网络能够利用序列数据，而这些数据在之前的技术中通常会丢失。这类网络形成了双向的信息流，因此需要动态内存。最近，深度学习网络(DLnet)变得非常流行，并且性能超过了大多数机器学习方法[92]。

2.3.1.3 混合云技术（集成模型学习）

混合模型集成了不同的个体预测模型，从而克服了预测模型的若干局限性，但代价是最终解决方案的更高复杂度。主要目标是以提高最终预测准确性的方式选择并恰当地组合一组预测技术。通过结合个体预测模型的优点并最小化其缺点，实现准确性的提升。近年来，混合模型已广泛应用于电力市场解决方案[75,93–96]。

先进机器学习和组合方法，例如集成学习，已变得非常流行。集成学习通常指一类生成多个模型的方法，这些模型随后被组合起来以做出最终预测。组合模型的主要目标是提高其泛化能力、鲁棒性，并提升结果准确性[97–99]。

集成过程（图 2.3）包含 3 个阶段，称为过量生成并选择方法[100]。第一阶段是集成生成。在此阶段，生成一组模型。重点在于模型的多样性，可以将其表征为基模型之间不一致的程度。根据创建基

示意图2

模型的归纳算法的数量，主要有两种集成模型生成方法：同质[101]和异质[102]。同质集成中模型的多样性可以通过对单一归纳算法的输入（数据或参数）进行操作来实现。

第二阶段称为集成剪枝。在此步骤中，通过移除一些冗余或精度较低的模型来对先前生成的模型集进行剪枝。剪枝的目标是找到一组数量较少且具有多样性的模型，以实现最高的预测精度，并在不损失准确性的前提下降低成本（例如由大量模型引起的内存大小或计算复杂度）。文献[97]中提出了多种剪枝方法，例如排序、基于搜索和基于划分的方法。

最后一个阶段是集成整合，该阶段应用各种策略来组合模型的结果，以获得更准确的最终预测结果。回归中的集成整合通常被定义为给定或计算出的权重与预测值的线性组合。已有多种提出的组合方法用于在集成中为预测模型生成权重。其中一些方法非常简单，无论模型的预测精度如何，都会生成均匀的权重，例如平均方法。更复杂的方法则基于实际或历史结果考虑模型的预测误差，以更动态的方式分配权重，并能够适应数据的变化，例如基于误差的方法或监控模型误差相关性的广义集成方法。其他高级组合方法的例子包括堆叠（堆叠泛化）、最小二乘回归，以及仿自然的和进化优化算法，这些方法试图最小化预测误差（例如MAPE、MAE、RMSE等）。

装袋法（BAGG）。 也称为自助聚合，是一种同质集成模型，通过生成多个版本的预测器（人工神经网络、分类与回归树）并将其组合以确定一个聚合预测器[103]。其集成方法为对所有预测器取平均值。这些多个版本是通过对训练集生成自助复制，并将这些复制作为新的训练集而形成的。某些观测值可能在新训练集中重复出现多次，而另一些则可能不会出现。装袋法能显著提高准确性，降低方差，并有助于避免过拟合。当扰动学习集对所构建的预测器产生显著影响时，装袋法有潜力提升准确性。

随机森林 (RF)。 该方法结合了装袋法和树节点分裂时的属性随机选择。随机决策森林的最初思想利用了随机子空间法[104]。该算法的扩展由布雷曼[105]和阿黛尔·卡特勒[106]提出。布雷曼设计的随机森林算法适用于分类与回归任务。在训练阶段，该方法根据给定的任务生成大量决策树或回归树。

2.3 智能电网问题中使用的方法概述

该方法的输出通常是各个树的预测类别的众数（在分类任务中）或预测值的均值（在回归任务中）。

极度随机树 (XRT)。 它是一种基于树的同质集成方法，结合了装袋法和随机子空间法，旨在解决监督分类和回归问题[107]。该方法在分裂树节点时采用属性和切分点选择随机化。在某些极端情况下，它可以生成随机化树，其结构独立于学习样本的输出值。通过合理选择参数，可以调节随机化的影响程度。

极端梯度提升 (XGB)。 一种基于树的同质集成方法，通过迭代生成新模型，以形成由“弱”模型组成的集成模型[108]。每个后续模型的创建旨在最小化根据先前集成模型的残差计算出的损失函数。它支持多种目标函数，包括回归、分类和排序。回归树的梯度提升特别适用于挖掘非预处理数据。除了通过平均方法集成模型的集成方法外，提升法无法并行化。

2.3.2 优化方法

优化方法在智能电网和微电网的能源管理中具有重要作用，同时也在许多其他领域得到了应用。随着元启发式算法研究的兴起，已开发出多种不同的方法。然而，目前尚无简单的元启发式算法分类法，主要原因是存在多种可能的划分准则，而这些准则并不总是互斥的。例如，布鲁姆和罗利[109]提出了以下准则：
• 仿自然的与非仿自然的（例如：灰狼优化器 vs. 禁忌搜索），
• 基于种群的与单点搜索（例如：粒子群优化 vs. 模拟退火），
• 动态的与静态目标函数（例如：引导局部搜索），
• 一种与多种邻域结构，
• 使用记忆与无记忆方法。

在本节中，我们介绍了一些最流行的仿自然优化算法，这些算法也在我们的实验中使用。此外，我们还简要概述了一类新兴的优化算法——超启发式算法。

2.3.2.1 粒子群体优化

最流行且广泛使用的优化算法之一是粒子群优化（PSO），其最初目的是模拟群体行为，经过一系列简化后可作为通用优化算法使用，并于 1995[110]中首次提出。自那时起，它已成为最受欢迎和广泛应用的元启发式算法之一，衍生出众多变体——从2010年到2016年，在 Scopus和IEEE数据库中包含particle swarm optimization关键词的已发表文章达35,614篇。由于已有大量教程详细讲解该算法的内部机制，本文仅提供简要概述。

PSO是一种基于种群的算法，属于群体智能算法的一类。群体中的每个粒子（种群中的个体）代表一个潜在解（位置） in

2.3 智能电网问题中使用的方法概述

搜索空间）映射到给定问题，其适应度由成本函数确定以进行优化，并记住其迄今为止找到的最佳位置（局部最优）。同时，还会记录所有粒子中的全局最优位置。在算法的每次迭代中，每个粒子的新位置由当前数据速度、局部最优位置（每个粒子特有）和全局最优位置（所有粒子共享）组合决定。数据速度的计算通过（2.7）完成。
vi(t+ 1)= w ∗ vi(t)+ c1 ∗ rand() ∗(lbestp i(t)−pi(t)) (2.7) +c2 ∗ rand() ∗(gbestp(t)−pi(t))
vi(t)是群体中第i个粒子在迭代t时的velocity，参数 w、 c1和 c2分别为粒子的惯性权重和加速常数，它们影响粒子向局部最优和全局最优移动的速度（这些参数可以调整），rand()是返回一个随机数的函数，pi(t)和lbestp i(t)分别是粒子的当前位置和当前局部最优位置，而 gbestp(t)是全局最优位置。然后，粒子的新位置就是当前位置与新计算出的velocity之和（ 2.8）。
pi(t+ 1)=pi(t)+ vi(t+ 1) (2.8)

2.3.2.2 人工蜂群算法

人工蜂群（ABC）算法也属于群体智能算法，最初在 2007[111]中提出。该算法受到蜜蜂寻找食物行为的启发。种群中的每个个体代表优化问题的一个潜在解，在本算法中，我们将个体称为蜜蜂，每只蜜蜂属于以下三种角色之一：雇佣蜂、观察蜂或侦察蜂。每种角色具有不同的功能和行为，它们共同确保对局部极小区域的有效开发以及对未探索解空间的探索。在算法初始化阶段，种群中一半个体被赋予雇佣蜂角色，另一半被赋予观察蜂角色。每个雇佣蜂以随机位置（即优化问题的一个解）进行初始化，并计算其适应度。该算法通过以下步骤迭代执行：
(1)每只观察蜂随机选择一只采蜜蜂来协助其进行局部搜索。采蜜蜂的适应度越高，被观察蜂选中的概率就越大。(2)每只采蜜蜂在其局部邻域内的解空间中随机选择一个新位置。如果新位置具有更高的适应度，则该蜜蜂移动到新位置；否则，它保持在当前位置。(3)如果在一定数量的迭代内，当前采蜜蜂未找到更优解（无论是自身还是分配的观察蜂均未找到），则该蜜蜂将放弃当前解，并转变为侦察蜂。(4)每只侦察蜂在解空间中移动到一个随机位置。如果新位置优于旧位置，则该侦察蜂重新变为采蜜蜂；否则，在下一次迭代中，它将移动到另一个随机位置。

雇佣蜂的局部解开发由观察蜂来保证。搜索空间的探索以及寻找新的更优局部极值由侦察蜂来完成。在原始论文[111]中，ABC算法与另外三种算法（PSO、遗传算法和粒子群启发式进化算法）在五个不同的基准函数（格里旺克、拉斯特金、罗森布罗克、阿克利和施韦费尔函数）上的表现。在后续研究中[112]将差分进化加入对比。根据已发表的结果，人工蜂群算法（ABC）表现最佳，在5个基准函数中的4个收敛到全局最优解。尽管差分进化也取得了类似的结果，但在最后一个基准函数（罗森布罗克）上，人工蜂群算法（ABC）得到了明显更优的解。尽管该算法仅在多峰连续函数上进行了评估，但值得注意的是，人工蜂群算法（ABC）已成功应用于离散优化问题，例如流水车间调度优化问题[113]或一组整数规划[114]，并在这些问题上与多种粒子群优化算法以及分支定界法进行了比较。

2.3.2.3 遗传算法

遗传算法（GA）是最基本的进化随机优化算法之一。它于20世纪70年代被提出[115]，自此以后已成为使用最广泛的进化优化算法之一。近年来，从2012年至今，在Scopus数据库中收录的包含genetic algorithm关键词的论文已超过46,500篇。该算法的主要灵感来源于生物进化过程，即通过亲代染色体的组合生成新个体的染色体。因此，遗传算法是一种基于种群的算法，其中种群中的每个个体代表一个解，称为染色体。染色体本质上是一个二进制向量，向量中的一项称为基因。由于个体以二进制形式表示，因此选择合适的解编码方式至关重要。每个染色体都会被赋予一个适应度值，并在繁殖过程中生成新一代的染色体。用于生成新染色体的父代染色体是准随机选择的——适应度越高，被选中的概率越大。随后，通过使用遗传算子来产生父代的后代。这些算子包括：
• 交叉—结合父代染色体的部分以创建新的染色体，
• 变异—随机翻转染色体中的一个基因。

这些遗传算子有许多变体，包括增加倒位（翻转染色体中的所有基因）。当新种群生成后，会计算每个个体的适应度，并重复繁殖过程，直到满足停止准则。

2.3.2.4 超启发式算法

顾名思义，超启发式算法运行于启发式方法和元启发式算法之上。一个简单且易于理解的定义[116]指出，超启发式算法主要有两类：
• 启发式选择——从一组预定义的低层启发式（可以是简单的启发式或元启发式）中为优化问题选择最合适的启发式，或者创建一个启发式序列，用于优化问题以获得更好的结果（更接近最优解，或更快且计算成本更低）；
• 启发式生成——通过遗传编程，利用一组预定义的操作符生成新的启发式，使其适用于特定的优化问题，或可应用于其他优化问题（可重用的启发式）。

2.4 提出的方法

大多数相关研究工作都集中在解决困难的组合问题上，例如装箱问题、教育时间表安排、旅行商问题、SAT问题等。少数研究致力于连续域优化的适应性问题[117–119]。尽管这类超启发式算法的应用实例较为罕见，但它们仍取得了一些有趣的结果，因此我们认为这种适应性具有潜在的研究价值。

每种超启发式算法中的选择机制是超启发式算法中最重要的部分之一。它需要回答两个关键问题：下一个应使用哪个低层启发式算法，以及何时进行切换？一个用于确定是否切换低层启发式的简单度量示例[120]包含了一个由模拟退火、禁忌搜索、遗传算法和k‐均值算法组成的低层启发式算法池。作者采用了两种算子：改进检测算子和多样性检测算子，分别追踪低层启发式算法的收敛速度以及种群标准差（仅用于遗传算法）。当其中一个算子超过设定的阈值（例如收敛速度过小）时，当前运行的启发式算法将被停止，并从算法池中选择另一个低层启发式算法继续搜索。下一个低层启发式算法的选择采用的是简单的随机选择，尽管也可以引入更复杂的选择方法，例如包含从一个低层启发式算法转移到另一个的概率的马尔可夫链，其中这些概率在搜索过程中根据各个低层启发式算法的实际表现进行更新[118]。根据在搜索过程中是否使用反馈信息，我们还可以进一步区分具有以下特点的超启发式算法：
• 在线学习——结合强化学习或元启发式算法方法，以动态适应搜索过程；
• 离线学习——在优化开始前进行学习，该方法类似于机器学习技术，我们从一组训练集问题中获取知识，期望这些知识能够泛化到之前未见过的优化问题上；[121]，以及
• 无学习——尽管简单，但在某些情况下，即使是随机选择也能产生有趣的结果。

超启发式算法在搜索过程中逐步构建解（即所使用的低层启发式算法的序列）。这种方法被称为构造性超启发式算法[121]。另一种选择是扰动方法——不是逐步构建低层启发式算法的序列，而是先生成一个完整的序列（通常基于随机初始化），然后在搜索过程中通过更改序列中的算法对其进行修改。我们可以将算法序列视为一个向量，而所有其他组合则构成一个向量空间，因此寻找最优算法序列本质上是一个局部搜索问题。关于超启发式算法的分类及其各类别相关文献的详细描述可参见[121]。

2.4 提出的方法

在我们的研究中，我们关注了多个与智能电网相关的问题，例如智能电网与微网优化、可再生能源推荐与生产预测、电力用户聚类。但我们主要集中在智能电网环境中的预测问题，特别是电价和电力负荷预测。在本节中，我们提出了在这些领域的新方法和研究发现。

2.4.1 电价预测

为了预测电力现货价格，我们提出了一种基于传统的大数据分析流程的框架[2]。该框架主要利用大量结构化数据来构建电力价格预测系统。该框架包含三个主要阶段，在从数据输入到预测模型构建的过程中引入了不同类型的增强方法。

在第一阶段，对包含电价、天气和负荷的数据集进行数据采集、集成、清洗、特征选择和数据降维。使用Hadoop分布式文件系统（HDFS）存储数据，并以MapReduce函数作为计算框架，其中映射函数执行过滤和排序，归约函数执行汇总操作。数据在云计算系统中由MapReduce函数处理，从而实现可并行扩展的应用开发[122]。第一个增强方法是根据尖峰出现的概率随时间水平切分电力价格数据。该操作生成多个数据集，作为下一阶段的输入。在此阶段，由于影响不同时间段的基本因素不同，需要进行不同的数据准备。其思路是将价格变化进行分离，以便针对具体任务使用专用模型。

在第二个建模阶段，使用计算智能方法从输入数据中提取模式。我们决定在低概率尖峰区间使用支持向量回归方法（SVR）进行点预测，并使用循环神经网络（RNN）进行尖峰的点预测。选择RNN是因为其能够处理任意输入序列并利用序列信息。第二种增强方法是引入分类器来预测尖峰出现的概率。通过这种方式，我们可以深入研究不同基本因素对尖峰发展的影响，并在生成尖峰时利用序列信息。

在第三（最后）阶段，引入衡量指标——平均绝对百分比误差、每日加权绝对误差和平均绝对缩放误差[4]。这些指标用于评估所提出的增强方法。在实验阶段结束时，我们应该能够识别出哪种增强方法是有用的，并且相较于未使用该特定增强方法或其组合的情况，能够提升最终预测的性能。

该框架目前仍在建设中，尚未进行评估。

2.4.2 电力负荷预测

存在许多可用于负荷预测的预测方法（参见第2.3节）。预测方法的性能取决于其对负荷预测特性的适应程度，例如双重季节性（日和周）、由节假日、夏季休假、天气等因素引起的电力消耗的突变或增量变化，以及来自智能电表的输入测量值的流式特性。我们研究了多种方法（包括统计方法和基于人工智能的方法），以确定哪些方法适用于电力负荷预测，即哪些方法的准确性最高。为了评估这些方法的准确性，我们采用了平均绝对百分比误差（MAPE）。

我们研究的方法列于表2.1中。除了现有方法外，对比还包括我们提出的两种电力负荷预测方法——自适应集成学习和online support vector regression。它们的设计在以下小节中描述，旨在实现对消费变化的适应性以及输入测量值的增量或在线处理。

在我们的实验中，我们使用以下方法预测未来24小时的电力消耗：
• 10不同的现有预测方法，
• 7预测方法的变体，使用工作日和周末的两个独立模型进行预测（标注为“‐周”后缀），以及
• 2我们提出的预测方法。

每种方法均采用增量方式工作，并基于滑动窗口的数据进行预测。每种方法的参数、输入数据以及滑动窗口的最佳窗口大小均通过在训练数据集上进行的一系列实验精心选择（见表2.1）。

2.4.2.1 电力负荷预测的自适应集成模型学习

该方法基于异质集成学习[125]，采用一组不同的基础预测模型。用于组合基础预测模型结果的权重通过选定的生物启发算法进行估计。该集成方法能够快速适应目标变量分布的变化，具有比单一预测方法获得更准确结果的潜力，并且可以简单地并行化，使其适用于云环境。

与传统的三阶段集成学习不同，我们的解决方案仅包含两个阶段：集成生成和集成整合。该集成方法旨在进行提前一天的预测。数学上，设 h为每日可获得的观测值数量（例如，若为小时级测量，则 h= 24；若为半小时级测量，则 h= 48等）。 h同时也是下一步预测的数量。集成基础集合中的每个预测模型均在不同大小的训练数据（称为数据块）上进行训练，以捕捉日或周季节性依赖，并获得更准确的预测结果。

集成预测通过 m基模型所做加权预测的线性组合来计算。设 ˆYt为 m基模型对未来 h个观测值在第 t（2.9）天的预测矩阵，且wt=(wt 1,…, wt m)T是第 m天基模型的权重向量，在第 t天的观测值可用之前确定。权重与特定预测相结合以生成集成预测ˆyt。
Yˆt= ⎛⎜⎜⎝yˆ t 11 ··· yˆ t 1m
… … …
yˆ t h1 ··· yˆ t hm
⎞⎟⎟⎠=(yˆt 1,…, yˆt m) (2.9)
第 k个观测值的集成预测由（2.10）计算得出。
yˆ t k= ∑
m j=1 yˆ t kj wt j
∑
m j=1 w t j
(2.10)

确定基础预测模型的适当权重可被视为一个带有约束的优化问题。为解决该问题，我们使用具有元启发式算法的生物启发式优化算法。在我们的评估中，仔细研究并测试了3种选定的生物启发算法。所选算法的设置将在下一节中描述。

优化算法设置
本研究使用了三种生物启发算法，用于计算集成模型中基础预测模型的最优组合权重。其中两种算法基于群体智能（PSO 和 ABC），另一种基于进化机制（GA）。这些算法均以平均绝对百分比误差（MAPE）作为适应度函数，并对其进行最小化。它们使用个体种群（也称为粒子）来表示解，个体的维度由基础方法的数量 m决定。

表2.2 预测方法在6个月测试集上的MAPE评估。每种方法基于选定大小的滑动窗口（即数据块）中的数据进行增量预测。“‐周”后缀表示单独的工作日/周末模型
预测方法	窗口（天）	平均绝对百分比误差（%）
粒子群优化（集成学习）	1	3.74
遗传算法（集成学习）	1	3.74
遗传算法（集成学习）	1	3.75
随机森林‐周	3	4.12
BAGG	14	4.60
在线支持向量回归	1	4.72
极端随机树‐周	8	4.72
BAGG‐周	14	4.79
DSHW	6	5.02
STL（季节性‐趋势‐残差分解）+ ARIMA‐周	10	5.10
XGB‐周	14	5.24
XGB	14	5.25
XRT	14	5.27
STL（季节性‐趋势‐残差分解）+ ES‐周	7	5.29
RF	8	5.47
SVR‐周	9	5.52
SVR	14	5.63
DLnet	14