图片来源:Pixabay:www.pexels.com/photo/blue-solar-panel-board-356036/
目录
∘ 简介 ∘ 为什么预测太阳能? ∘ 数据 ∘ 数据探索性分析 ∘ 为什么选择 Prophet? ∘ 模型评估标准 ∘ 基线模型 ∘ Prophet 模型(默认超参数) ∘ Prophet 模型(调整超参数) ∘ 结果与讨论 ∘ 未来步骤 ∘ 结论 ∘ 参考文献
简介
德国目前正在经历能源转型,这是一个长期向净零碳经济过渡的过程,主要利用可再生能源资源发电。太阳能对于确保德国的能源安全发挥着关键作用。
因此,这一过渡的成功在很大程度上取决于准确预测未来太阳能产出的能力。本文探讨了使用 Prophet 库在德国预测太阳能发电可行性的问题。
为什么预测太阳能?
预测太阳能发电带来诸多益处:
- 确保供需平衡
在向可再生能源过渡的关键挑战中,确保清洁能源源在任何时候都能满足电力需求至关重要。预测未来的太阳能发电量对于提供足够的能源同时避免任何短缺或过剩将是必不可少的。
2. 改善储能管理
由太阳能产生的电力通常储存在电池中。预测产生的能量有助于优化在阳光照耀时产生的能源管理,最大限度地减少在过程中削减的能源量。
3. 促进太阳能市场增长
准确的太阳能预测有助于将太阳能视为可靠的能源来源。表现稳定的太阳能市场将吸引更多投资,这将导致更多太阳能板的建设和维护。
4. 保护环境
准确的太阳能预测有利于提高能源安全。将太阳能确立为可靠的可再生能源将加速摆脱碳排放数据源,并全面应对气候变化。
数据
将用于执行项目的时序数据集由Agora Energiewende提供。他们的团队提供了Agorameter,该工具按小时跟踪各种来源的电力生成情况。
探索性数据分析
详细的 EDA 将揭示数据的本质,识别局限性,并指出最适合使用此数据预测太阳能发电量的模型。
- 预览数据集:
预览(由作者创建)
2. 在数据集中搜索缺失值
缺失值(由作者创建)
3. 可视化时间序列
时间序列(由作者创建)
4. 使用箱线图检查值的分布
箱线图(由作者创建)
5. 按小时检查分布
每小时分布(由作者创建)
6. 按月份检查分布
每月分布(由作者创建)
EDA 的关键发现:
该数据集记录了从 2023 年 8 月 1 日至 2024 年 8 月 31 日(1 年 1 个月)的每小时太阳能发电量。总体而言,数据集包含 9,528 条记录。尽管没有缺失值,但由于许多异常值,数据分布呈右偏态。
时间序列图显示数据在本质上具有很强的周期性,这是季节性成分的强烈指标。通过按月份和小时检查数据分布,很明显,太阳能发电量在很大程度上取决于年份的月份和一天中的时间。
在时间方面,太阳能发电量在上午 10 点到下午 5 点达到峰值,从晚上 8 点到次日凌晨 6 点几乎为零。在月份方面,夏季(6 月至 8 月)的发电量最高,冬季(11 月至 2 月)的发电量最低。这与我们的预期相符,因为夏季和白天阳光最为充足。
为什么选择 Prophet?
Prophet 是 Meta 公司自己开发的用于开发预测模型的库。它基于一个加性回归模型生成预测,即使在存在缺失值和异常值的情况下也能表现良好。
在内部,Prophet 使用傅里叶级数(即使用正弦和余弦函数捕捉模式)来模拟时间序列中的季节性成分,使其能够处理数据集中的多个季节性模式。
由于太阳能发电数据集包含异常值,并在日和年水平上表现出季节性,Prophet 非常适合这项预测任务。此外,与需要更多训练时间和计算资源的神经网络等替代方案相比,它更受欢迎。
模型评估标准
模型将使用包含 1 年记录的训练集进行训练,并使用包含 1 个月记录的测试集进行评估。
在预测太阳能发电时,大误差尤其有害,因为它们可能导致电力短缺和过剩更加严重。因此,模型将基于均方根误差指标进行评估,该指标对较大误差的惩罚力度很大(与其他传统指标如平均绝对误差相比)。
均方根误差公式(由作者创建)
基线模型
将创建一个基线模型以对 Prophet 模型的性能进行上下文化。基线模型将预测所有值等于训练数据集中的平均发电量。
708

被折叠的 条评论
为什么被折叠?



