关键词:图神经网络GNN、区域风光功率预测、风电功率预测、光伏功率预测、场站相关性、时空预测、图注意力GAT、STGCN、DCRNN、Graph WaveNet、Transformer、Informer、多源气象融合、概率预测、P10/P50/P90、虚拟电厂、风光基地、聚合预测、偏差考核、现货交易
1. 为什么“区域预测”不能只做“逐站预测再求和”?
在风光基地、集团多场站、虚拟电厂(VPP)等场景里,预测目标往往不止是“某一个风电场/光伏电站准不准”,而是:
-
区域总出力(聚合功率)要稳定、误差要小;
-
空间分布要合理,便于调度和断面约束评估;
-
爬坡风险要可控,储能和备用安排要有依据;
-
交易报量要有概率区间(P10/P50/P90),便于风险定价。
很多系统的默认做法是:

看似合理,但容易踩三个坑:
-
场站误差相关性被忽略:同一股天气系统影响多个场站,误差会同涨同跌。
-
空间传播规律缺失:风带/云带有移动方向,上游变化会先出现,下游滞后出现。
-
聚合误差不等于逐站误差之和:逐站看起来都“还行”,但聚合后的峰值偏差可能更大。
因此,区域级风光功率预测要更准,必须显式建模:
场站之间的“互相影响”(空间相关性 + 传播关系 + 共因子耦合)。
这正是图神经网络(GNN)在新能源预测场景里最核心的价值。
2. 场站“互相影响”到底是什么?先把影响机制讲清楚
所谓“互相影响”,并不是说电站真的会互相“改变彼此的出力”,而是指:
多场站功率变化 共同受同一个或相近的气象驱动因素影响,从而在统计上表现为相关性与时空耦合。
常见的三类耦合机制:
2.1 同因子耦合(Common Driver)
-
同一冷空气过程影响一个区域内多个风电场;
-
同一云系影响多个光伏电站;
-
导致多个场站功率“同涨同跌”。
2.2 空间传播耦合(Propagation)
-
风带沿地形走廊移动;
-
云团沿风向平移;
-
上游站点先变化,下游站点后变化(存在时间滞后)。
2.3 网络耦合(Network Constraint)
-
同一升压站/同一送出通道的功率会受共同的约束(限发、断面)。
-
导致多个场站出力在某些时段出现“共同截断”。
这些机制决定了:区域预测是一个典型的时空序列预测问题。
3. 为什么选择 GNN?它在区域预测里解决什么痛点?
传统模型的表达方式通常是:
-
每个站点一个独立模型(LSTM/Transformer),最后求和;
-
或把所有站点拼成一个大向量输入(维度爆炸、难训练)。
GNN 的优势在于:
-
天然适配“多节点系统”:一个场站=一个节点,区域=一张图;
-
能把“空间关系”变成可学习的参数:边权、注意力可以学习;
-
计算规模可控:节点增加时不需要把输入拼成超大向量;
-
可解释性更强:可以看到哪些站点对哪些站点影响大(边权/注意力)。
一句话:
GNN 是把“空间相关性”显式编码进模型结构里,而不是希望模型“自己悟出来”。
4. 建模核心:如何把“场站互相影响”转成一张图?
这是 GNN 是否落地的关键:图怎么构建?边怎么定义?
设区域有 NNN 个场站,构建图:
G=(V,E,W)G=(V,E,W)G=(V,E,W)
-
VVV:节点(场站)
-
EEE:边(站点之间的连接关系)
-
WWW:边权(影响强度)
4.1 图构建方法一:地理邻接图(Geo-kNN)
最常见、最稳妥的基线:
-
每个场站连接距离最近的 kkk 个场站;
-
边权与距离成反比:

优点:简单稳定、可解释。
缺点:无法表达“非近邻但强相关”的情况(例如同一风廊道)。
4.2 图构建方法二:相关性图(Correlation Graph)
用历史数据计算相关性:
-
Pearson 相关、互相关、互信息;
-
取相关性前 kkk 的站点连边。
特别建议加入“时间滞后互相关”,捕捉传播关系:

取最大相关时的滞后 τ\*\tau^\*τ\* 作为传播延迟特征。
优点:能捕捉“远距离强相关”。
缺点:相关性会随季节/天气型变化,需要动态更新。
4.3 图构建方法三:气象驱动图(Weather Similarity Graph)
更高级、效果通常更好:
-
用多源气象融合场特征(风速、风向、云量、辐照等);
-
计算站点之间气象特征相似度;
-
相似度高的连边。
优点:贴近物理机制,泛化更强。
缺点:需要稳定的气象数据底座。
4.4 动态图(Dynamic Graph):让边权随时间变化
区域风光的相关性不是常数,而是随天气型变化的。
动态边权思路:

这里 f(⋅)f(\cdot)f(⋅) 可由小型网络学习,实现“今天云系从西往东走,就让西→东边权变大”。
工程建议:
先用“地理kNN图”跑通;
再引入“相关性图”;
最后升级“气象驱动动态图”。
这样稳、可控、迭代快。
5. 图神经网络怎么和时间序列结合?三类主流框架
区域功率预测是“图 + 时间”的组合,常见框架如下。
5.1 框架A:STGCN(空间卷积 + 时间卷积)
-
空间:图卷积(GCN)
-
时间:1D卷积(Temporal Conv)
适合:短临、局部时序模式明显的场景(如15分钟粒度)。
5.2 框架B:DCRNN(扩散卷积 + RNN)
-
空间:扩散图卷积(适合传播)
-
时间:GRU/LSTM
适合:存在明显传播滞后的风带/云带场景。
5.3 框架C:GAT/Graph WaveNet + Transformer/Informer(推荐)
-
空间:图注意力(GAT)或自适应邻接(Graph WaveNet)
-
时间:Transformer/Informer 处理长序列
适合:日内/日前预测、长序列、多站点规模较大。
推荐组合(工程可落地):
图注意力 GAT + Informer:
GAT 学“谁影响谁”
Informer 学“未来怎么演变”
并且可扩展到概率预测(分位数输出)。
6. 输入特征怎么设计?别只喂功率
要把“互相影响”建模好,输入不要只有功率历史,建议至少包含:
6.1 功率与状态(必选)
-
历史功率 Pi(t−L:t)P_i(t-L:t)Pi(t−L:t)
-
可用容量/限发标记(关键)
-
设备状态(停机、检修、故障)
6.2 多源气象(强烈建议)
-
风电:轮毂高度风速风向、边界层高度、温度、气压
-
光伏:GHI/DNI/云量、温度、湿度
6.3 时间与日历特征(必选)
-
时刻、星期、节假日
-
DOY(年内日序)用于季节变化
6.4 站点静态特征(可选但有帮助)
-
经纬度、高程、地形坡度
-
装机容量、机型/组件类型
-
场站类型(风/光)
重点提醒:
如果不把“限电/检修”显式输入或剔除训练样本,区域模型会学到错误规律,导致聚合预测被“共同截断”拖偏。
7. 输出层:点预测不够,区域预测更需要概率预测
交易与调度都需要“风险区间”:
-
P10:保守下界
-
P50:中位预测
-
P90:乐观上界

这样能避免“单站都准但聚合不准”的尴尬。
8. 评估与验证:怎么证明 GNN 确实带来增益?
建议从三层指标评估:
8.1 单站指标
-
nRMSE / nMAE / P95偏差
8.2 聚合指标(重点)
-
区域总功率 nRMSEagg_{agg}agg
-
爬坡误差(ramp error)
-
峰值偏差(max error)
8.3 业务指标(最终看这层)
-
偏差考核金额下降多少
-
平衡费用下降多少
-
现货交易收益增加多少
-
储能调度效率提升多少(循环次数/净收益)
工程经验里常见的规律是:
GNN 对聚合预测的提升幅度通常大于对单站预测的提升幅度。
因为它能显著降低“同涨同跌误差”与“传播滞后误差”。
9. 工程落地路线:从可用到可赚的四步法(建议直接照做)
Step 1:先跑通“地理kNN图 + 逐站预测基线”
建立对照组,确定收益基准。
Step 2:上线“GAT/Graph WaveNet + 时序模型”
先做点预测,再做聚合一致性约束。
Step 3:引入“动态图 + 多源气象融合”
边权随时间变化,显著提升天气过程适应性。
Step 4:升级“概率预测 + 调度策略仿真”
输出 P10/P50/P90,把预测转成交易/调度策略收益。
落地关键:
必须有回退机制(基线预测兜底)
必须有漂移监控(季节变化/机组变化)
必须把业务收益做成报表(不然很难推动推广)
10. 常见问题FAQ(利于百度收录)
Q1:图神经网络预测一定比 LSTM/Transformer 更准吗?
不一定。单站层面未必显著更准,但在“多场站聚合预测、空间传播场景”中,GNN通常优势明显。
Q2:边(场站关系)怎么选才最合理?
工程建议从“地理kNN”起步,再引入“历史滞后相关性”,最终用“气象相似度动态边权”作为最优方案。
Q3:没有高质量气象数据,能做 GNN 吗?
可以,但效果上限会受限。建议至少保证一套稳定NWP,并把限电/检修等状态处理干净。
Q4:GNN 适合 15分钟还是 1小时粒度?
两者都适合:
-
15分钟更适合 STGCN/CNN类短临结构;
-
1小时更适合 GAT + Transformer/Informer 的日内/日前结构。
11. 结语:区域风光预测的本质,是“把空间相关性变成可学习的结构”
区域风光功率预测真正的难点,不是“某个站点怎么建模”,而是:
多场站之间的共同驱动、传播滞后与网络约束,如何进入模型。
243

被折叠的 条评论
为什么被折叠?



