✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。
🍎 往期回顾关注个人主页:Matlab科研工作室
🍊个人信条:格物致知,完整Matlab代码及仿真咨询内容私信。
🔥 内容介绍
随着全球能源转型的加速,风能作为一种清洁、可再生的能源,在电力系统中的占比日益提高。然而,风能具有很强的随机性和波动性,这给电力系统的规划、运行和调度带来了巨大挑战。风场景生成与削减技术是应对这一挑战的重要手段,通过生成能够反映风能不确定性的多个场景,并从中筛选出具有代表性的场景,为电力系统的分析和决策提供可靠依据。
无监督聚类算法能够在无需先验标签的情况下,将数据按照内在的相似性进行分组,非常适合风场景的生成与削减。其中,m-ISODATA、k-means 和层次聚类(HAC)是三种常用的无监督聚类算法。本研究旨在探讨这三种算法在电力系统风场景生成与削减中的应用,分析它们的性能特点和适用场景,为提升电力系统对风能的接纳能力提供技术支持。
二、风场景生成与削减概述
(一)风场景生成
风场景生成是根据历史风速数据或风速预测模型,生成一系列能够反映未来风速可能变化的场景。每个场景包含特定时间段内的风速序列,以及对应的风电出力。风场景生成的关键是要保证生成的场景能够覆盖风速的各种可能变化,同时具有较高的真实性和代表性。
常用的风场景生成方法包括基于概率分布的方法、基于时间序列的方法和基于机器学习的方法等。基于概率分布的方法通过拟合风速的概率分布(如 Weibull 分布、正态分布等),随机生成风速样本;基于时间序列的方法(如 ARMA 模型、GARCH 模型等)则考虑风速的时间相关性,生成具有动态特性的风速序列;基于机器学习的方法(如生成对抗网络 GAN)能够捕捉风速数据的复杂非线性特性,生成更贴近实际的风场景。
(二)风场景削减
由于生成的风场景数量通常较多(可能达到数千甚至数万个),直接用于电力系统分析会导致计算量过大,影响决策效率。风场景削减的目的是在保证场景代表性的前提下,减少场景的数量,剔除冗余场景。
风场景削减的核心是场景的相似性度量和筛选策略。通过定义合适的相似性指标(如欧氏距离、曼哈顿距离、动态时间弯曲距离等),衡量不同场景之间的相似程度,然后采用聚类算法或启发式算法,将相似的场景合并,保留代表性场景。场景削减需要在场景数量和代表性之间进行平衡,既要减少计算负担,又不能丢失关键信息。
三、无监督聚类算法原理
(一)k-means 算法
k-means 算法是一种经典的基于划分的聚类算法,其基本思想是将 n 个数据点划分为 k 个簇,使得簇内数据点的相似度较高,而簇间数据点的相似度较低。
- 算法步骤:
- 随机选择 k 个数据点作为初始聚类中心。
- 计算每个数据点与各个聚类中心的距离(通常采用欧氏距离),将数据点分配到距离最近的簇。
- 重新计算每个簇的中心,即簇内所有数据点的均值。
- 重复步骤 2 和步骤 3,直到聚类中心不再发生明显变化或达到最大迭代次数。
- 特点:k-means 算法计算简单、收敛速度快,适用于大规模数据集。但它对初始聚类中心的选择较为敏感,容易陷入局部最优解,且需要预先指定簇的数量 k。
(二)层次聚类(HAC)算法
层次聚类(Hierarchical Agglomerative Clustering,HAC)算法通过构建聚类树( dendrogram)来实现数据的聚类。它分为凝聚式和分裂式两种,其中凝聚式层次聚类应用更为广泛,其基本思想是从每个数据点作为一个单独的簇开始,逐步将相似度最高的簇合并,直到形成一个包含所有数据点的簇。
- 算法步骤:
- 将每个数据点视为一个初始簇。
- 计算所有簇之间的相似度(如平均距离、最短距离、最长距离等)。
- 合并相似度最高的两个簇。
- 重复步骤 2 和步骤 3,直到达到预设的簇数量或所有数据点合并为一个簇。
- 特点:层次聚类不需要预先指定簇的数量,能够生成直观的聚类树,展示数据的层次结构。但它的计算复杂度较高(通常为 O (n²)),不适合处理大规模数据集,且一旦簇被合并就无法拆分,缺乏回溯机制。
(三)m-ISODATA 算法
m-ISODATA(Modified Iterative Self-Organizing Data Analysis Techniques Algorithm)算法是 ISODATA 算法的改进版本,是一种动态聚类算法,能够自动调整簇的数量。
- 算法步骤:
- 初始化参数,包括初始簇中心、最大迭代次数、最小簇内距离、最大簇数量等。
- 计算每个数据点与各簇中心的距离,根据距离阈值将数据点分配到相应的簇,对于距离大于所有簇中心阈值的数据点,创建新的簇。
- 计算每个簇的均值和标准差,若簇内数据点数量过少,则删除该簇;若簇内标准差过大,则将该簇分裂为两个簇。
- 重复步骤 2 和步骤 3,直到满足停止条件(如迭代次数达到上限或簇数量稳定)。
- 特点:m-ISODATA 算法能够自动调整簇的数量,具有较强的适应性,适用于数据分布未知的情况。但它的参数设置较为复杂,对参数的敏感性较高,计算过程也相对繁琐。
四、基于无监督聚类算法的风场景生成与削减实现
(一)风场景生成
以基于历史风速数据的场景生成为例,结合聚类算法的风场景生成过程如下:
- 数据预处理:收集历史风速数据,进行清洗(去除异常值、填补缺失值)和归一化处理,消除量纲影响。
- 初始场景生成:采用时间序列模型(如 ARMA)生成大量初始风场景,例如生成 1000 个包含 24 小时风速数据的场景。
- 聚类分析:使用 k-means、HAC 或 m-ISODATA 算法对初始场景进行聚类,将相似的场景归为一类。
- 代表性场景提取:从每个簇中选择一个代表性场景(如簇中心对应的场景),作为生成的最终风场景。
例如,使用 k-means 算法生成风场景时,可将初始场景的数量作为数据点数量,将每个场景的风速序列作为一个多维数据向量,通过 k-means 聚类将其划分为 k 个簇,每个簇的中心场景即为生成的代表性风场景。
(二)风场景削减
风场景削减的过程与生成过程类似,但输入是已生成的大量风场景(可能成千上万),输出是数量较少的代表性场景。
- 相似性度量:定义风场景之间的相似性指标,对于风速序列场景,可采用动态时间弯曲(DTW)距离来衡量序列之间的相似性,它能够较好地处理时间序列的非线性对齐问题。
- 聚类削减:应用聚类算法对大量风场景进行聚类,将相似的场景合并。例如,使用 HAC 算法对 5000 个风场景进行层次聚类,根据聚类树确定合适的簇数量,然后从每个簇中选择代表性场景,实现场景削减。
- 性能评估:通过计算削减前后场景的概率分布差异(如 KL 散度、Wasserstein 距离)、风电出力的统计特性(均值、方差)差异等指标,评估削减效果。
五、三种算法的性能对比与分析
(一)计算效率
在处理大规模风场景数据时,k-means 算法的计算效率最高,因其时间复杂度较低(通常为 O (nkt),其中 n 为数据点数量,k 为簇数量,t 为迭代次数),适合处理数万甚至数十万的场景数据。HAC 算法的计算效率最低,随着场景数量的增加,其计算量呈平方增长,仅适用于中小规模的场景数据。m-ISODATA 算法的计算效率介于两者之间,由于需要动态调整簇数量,其计算过程比 k-means 复杂,但优于 HAC。
(二)聚类效果
- k-means 算法:在场景分布较为均匀、簇结构明显的情况下,k-means 算法能够取得较好的聚类效果,簇内相似度高,簇间差异明显。但对于非凸分布、簇大小差异较大的风场景数据,其聚类效果可能不佳,容易受到异常值的影响。
- HAC 算法:能够较好地反映场景之间的层次关系,对于具有嵌套结构的风场景数据(如不同季节的风速场景),聚类效果较为直观。但由于其合并过程的不可逆性,可能会导致部分簇的划分不够合理。
- m-ISODATA 算法:由于能够自动调整簇数量,对于数据分布未知的风场景数据,m-ISODATA 算法具有更强的适应性,能够根据场景的实际分布生成合适的簇。但它对参数(如距离阈值、最小簇大小)的设置较为敏感,参数选择不当会影响聚类效果。
(三)适用场景
- k-means 算法:适用于大规模风场景的快速生成与削减,尤其是当已知大致的场景类别数量时,能够高效地得到聚类结果。例如,在电力系统短期调度中,需要快速生成数十个代表性风场景,k-means 算法是较好的选择。
- HAC 算法:适用于对风场景的层次结构进行分析,或者当场景数量较少(如数百个)时,用于生成具有层次关系的代表性场景。例如,在风电场规划中,需要分析不同风速等级下的场景特性,HAC 算法能够提供清晰的层次聚类结果。
- m-ISODATA 算法:适用于数据分布复杂、场景类别数量未知的情况,能够自动探索风场景的内在结构。例如,在处理多风电场联合运行的场景生成与削减时,由于各风电场的风速特性差异较大,m-ISODATA 算法能够更好地适应这种复杂性。
六、结论与展望
(一)研究结论
本研究探讨了 k-means、HAC 和 m-ISODATA 三种无监督聚类算法在电力系统风场景生成与削减中的应用,得出以下结论:
- 三种算法均能实现风场景的生成与削减,但在计算效率、聚类效果和适用场景上存在差异。k-means 算法计算高效,适用于大规模场景;HAC 算法能反映层次结构,适用于中小规模场景和层次分析;m-ISODATA 算法能自动调整簇数量,适用于分布复杂、类别未知的场景。
- 风场景生成与削减的效果依赖于合理的相似性度量和算法参数设置。在实际应用中,应根据场景数据的特点(规模、分布、结构等)选择合适的算法,并通过实验优化参数。
- 聚类算法通过保留具有代表性的风场景,能够在减少计算量的同时,较好地反映风能的不确定性,为电力系统的规划、运行和调度提供有效的支持。
(二)未来展望
未来的研究可以从以下几个方面展开:
- 算法融合与改进:结合三种算法的优势,提出混合聚类算法,例如先使用 HAC 算法确定大致的簇数量,再使用 k-means 算法进行精细聚类,以提高聚类效果和效率。同时,研究基于深度学习的聚类算法(如深度嵌入聚类),提高对复杂风场景数据的聚类能力。
- 多目标场景削减:目前的场景削减主要关注场景的代表性,未来可考虑多目标优化,在保证代表性的同时,兼顾场景的多样性和极端性,以应对电力系统中的突发情况。
- 动态场景生成与削减:风能的波动性具有动态特性,未来应研究动态聚类算法,实现风场景的实时生成与削减,为电力系统的实时调度提供支持。
- 应用拓展:将聚类算法应用于含高比例风电的电力系统可靠性评估、经济调度、市场交易等领域,进一步验证其有效性和实用性,推动风能在电力系统中的更高效利用。
⛳️ 运行结果





🔗 参考文献
[1] 李勇平.基于改进粒子群神经网络的电信业务预测模型研究[D].华南理工大学[2025-08-01].DOI:CNKI:CDMD:1.2010.047531.
[2] 张培兴.基于场景的自动驾驶汽车虚拟仿真加速测试与评价方法研究[D].吉林大学,2023.
[3] 贾秋燕.基于DW-DPoS的碳质押融资贷款风险识别与监管研究——以电力上市企业为例[D].中南财经政法大学,2022.
📣 部分代码
🎈 部分理论引用网络文献,若有侵权联系博主删除
👇 关注我领取海量matlab电子书和数学建模资料
🏆团队擅长辅导定制多种科研领域MATLAB仿真,助力科研梦:
🌈 各类智能优化算法改进及应用
生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化、背包问题、 风电场布局、时隙分配优化、 最佳分布式发电单元分配、多阶段管道维修、 工厂-中心-需求点三级选址问题、 应急生活物质配送中心选址、 基站选址、 道路灯柱布置、 枢纽节点部署、 输电线路台风监测装置、 集装箱调度、 机组优化、 投资优化组合、云服务器组合优化、 天线线性阵列分布优化、CVRP问题、VRPPD问题、多中心VRP问题、多层网络的VRP问题、多中心多车型的VRP问题、 动态VRP问题、双层车辆路径规划(2E-VRP)、充电车辆路径规划(EVRP)、油电混合车辆路径规划、混合流水车间问题、 订单拆分调度问题、 公交车的调度排班优化问题、航班摆渡车辆调度问题、选址路径规划问题、港口调度、港口岸桥调度、停机位分配、机场航班调度、泄漏源定位
🌈 机器学习和深度学习时序、回归、分类、聚类和降维
2.1 bp时序、回归预测和分类
2.2 ENS声神经网络时序、回归预测和分类
2.3 SVM/CNN-SVM/LSSVM/RVM支持向量机系列时序、回归预测和分类
2.4 CNN|TCN|GCN卷积神经网络系列时序、回归预测和分类
2.5 ELM/KELM/RELM/DELM极限学习机系列时序、回归预测和分类
2.6 GRU/Bi-GRU/CNN-GRU/CNN-BiGRU门控神经网络时序、回归预测和分类
2.7 ELMAN递归神经网络时序、回归\预测和分类
2.8 LSTM/BiLSTM/CNN-LSTM/CNN-BiLSTM/长短记忆神经网络系列时序、回归预测和分类
2.9 RBF径向基神经网络时序、回归预测和分类
2.10 DBN深度置信网络时序、回归预测和分类
2.11 FNN模糊神经网络时序、回归预测
2.12 RF随机森林时序、回归预测和分类
2.13 BLS宽度学习时序、回归预测和分类
2.14 PNN脉冲神经网络分类
2.15 模糊小波神经网络预测和分类
2.16 时序、回归预测和分类
2.17 时序、回归预测预测和分类
2.18 XGBOOST集成学习时序、回归预测预测和分类
2.19 Transform各类组合时序、回归预测预测和分类
方向涵盖风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、用电量预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断
🌈图像处理方面
图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知
🌈 路径规划方面
旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、 充电车辆路径规划(EVRP)、 双层车辆路径规划(2E-VRP)、 油电混合车辆路径规划、 船舶航迹规划、 全路径规划规划、 仓储巡逻
🌈 无人机应用方面
无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配、无人机安全通信轨迹在线优化、车辆协同无人机路径规划
🌈 通信方面
传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化、水声通信、通信上传下载分配
🌈 信号处理方面
信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化、心电信号、DOA估计、编码译码、变分模态分解、管道泄漏、滤波器、数字信号处理+传输+分析+去噪、数字信号调制、误码率、信号估计、DTMF、信号检测
🌈电力系统方面
微电网优化、无功优化、配电网重构、储能配置、有序充电、MPPT优化、家庭用电
🌈 元胞自动机方面
交通流 人群疏散 病毒扩散 晶体生长 金属腐蚀
🌈 雷达方面
卡尔曼滤波跟踪、航迹关联、航迹融合、SOC估计、阵列优化、NLOS识别
🌈 车间调度
零等待流水车间调度问题NWFSP 、 置换流水车间调度问题PFSP、 混合流水车间调度问题HFSP 、零空闲流水车间调度问题NIFSP、分布式置换流水车间调度问题 DPFSP、阻塞流水车间调度问题BFSP
👇
775

被折叠的 条评论
为什么被折叠?



