从2022年开始,以华为pangu weather为代表的气象大模型及fuxi、fengwu等相继涌现,公开发表的文章里也展示了模型与ec预报性能的对比,并且这些大模型也公开了相应的代码或模型,便于人人都可测试使用(如何在本地部署大模型可以参考如何在本地部署现有气象大模型_pip install ai-models-panguweather-优快云博客
)。
最近尝试对这些大模型尝试进行了相关研阅调研分析,以下是个人的几点思考,也欢迎各位老师专家批评指正(也可以直接看第八条):
首先,气象大模型在运行效率上的优势比较明显,哪怕穷人版GPU(我用的20年titan rtx)也仅需10多分钟即可实现未来10天全球25公里逐6小时不同等压层的rtuv预报。这与现在主流预报方式是不同的。
其次,从预报性能来说,各模型也都在文章里指出相较于ifs在mse、mae、rmse等方面的优势。因为模型本身在进行参数优化的时候都是以mse、mae、rmse作为loss,所以只要这个问题是可学习的(后面第八条我们讨论为什么可学习),那么模型在mse、mae、rmse指标上是可以达到局部最优的。
第三,我们从模型角度看,无论是pangu、fuxi、fengwu,都仍然是标准transform系列,所以如果对于计算机视觉方向的研究人员来说,模型方法的优势相对于CVPR、iccv等上面的文章吸引力反倒不足。
但是,第四点,不得不提的是,气象输入数据确实庞大,这在计算机视觉里的相关任务还是需要做很多研究工作。而且可以注意一点,大模型里习惯称不同的气象要素为不同的模态。
第五,其实对任意简单的深度学习模型(任意跟视频预测相关的),我们前期有相关实验发现模型性能也都可以,但做不到长序列,所以气象大模型非常让人眼前一亮的点就

本文分析了气象大模型如华为PanguWeather的优点,包括运行效率高和预报性能优于IFS。作者指出模型的长序列预测能力是其亮点,但大模型的上限可能受限于训练数据和模型结构。讨论了模型训练与IFS预报的关系以及未来可能的发展阶段。
最低0.47元/天 解锁文章

1548





