1. 引言:从“能用”到“多 1%”的价值
在你现在这种实际工程场景里,模型已经“能用”:
-
有比较成熟的 NWP(气象预报)/SCADA 数据管线;
-
有 LSTM / GRU / 其他深度网络在跑预测;
-
指标上大致可控,调度侧也能用。
接下来最难的,往往不是从 70 分到 85 分,而是——在已经还不错的基线之上,再挤出 1% ~ 2% 的提升:
-
nRMSE 每降 1%,大区级别一年可能就是几百万到几千万的经济效益(备用压减、罚款降低、交易收益等);
-
也是你后面写方案、汇报“新一代模型”的最硬核的一行数字。
想多这 1%,只换个模型名字肯定不够,必须做到:
“结构合适 + 细节到位 + 损失和业务一致”。
本文围绕一个非常工程向的模型组合:
CNN-BiLSTM-Attention 回归预测架构,系统性谈谈如何在现有管线基础上,稳稳地去拿这 1%。
2. 场景与问题定义:多变量短期回归
从任务形式上看,我们做的是标准的多变量时间序列回归:
-
输入:过去 (L) 个时间步的多源特征

订阅专栏 解锁全文
775

被折叠的 条评论
为什么被折叠?



