关于现有预报气象大模型的能力上限思考

最新推荐文章于 2025-11-25 14:31:30 发布

原创

最新推荐文章于 2025-11-25 14:31:30 发布 · 791 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #机器学习

本文分析了气象大模型如华为PanguWeather的优点，包括运行效率高和预报性能优于IFS。作者指出模型的长序列预测能力是其亮点，但大模型的上限可能受限于训练数据和模型结构。讨论了模型训练与IFS预报的关系以及未来可能的发展阶段。

从2022年开始，以华为pangu weather为代表的气象大模型及fuxi、fengwu等相继涌现，公开发表的文章里也展示了模型与ec预报性能的对比，并且这些大模型也公开了相应的代码或模型，便于人人都可测试使用（如何在本地部署大模型可以参考如何在本地部署现有气象大模型_pip install ai-models-panguweather-优快云博客

）。

最近尝试对这些大模型尝试进行了相关研阅调研分析，以下是个人的几点思考，也欢迎各位老师专家批评指正（也可以直接看第八条）：

首先，气象大模型在运行效率上的优势比较明显，哪怕穷人版GPU（我用的20年titan rtx）也仅需10多分钟即可实现未来10天全球25公里逐6小时不同等压层的rtuv预报。这与现在主流预报方式是不同的。

其次，从预报性能来说，各模型也都在文章里指出相较于ifs在mse、mae、rmse等方面的优势。因为模型本身在进行参数优化的时候都是以mse、mae、rmse作为loss，所以只要这个问题是可学习的（后面第八条我们讨论为什么可学习），那么模型在mse、mae、rmse指标上是可以达到局部最优的。

第三，我们从模型角度看，无论是pangu、fuxi、fengwu，都仍然是标准transform系列，所以如果对于计算机视觉方向的研究人员来说，模型方法的优势相对于CVPR、iccv等上面的文章吸引力反倒不足。

但是，第四点，不得不提的是，气象输入数据确实庞大，这在计算机视觉里的相关任务还是需要做很多研究工作。而且可以注意一点，大模型里习惯称不同的气象要素为不同的模态。

第五，其实对任意简单的深度学习模型（任意跟视频预测相关的），我们前期有相关实验发现模型性能也都可以，但做不到长序列，所以气象大模型非常让人眼前一亮的点就