关于现有预报气象大模型的能力上限思考

本文分析了气象大模型如华为PanguWeather的优点,包括运行效率高和预报性能优于IFS。作者指出模型的长序列预测能力是其亮点,但大模型的上限可能受限于训练数据和模型结构。讨论了模型训练与IFS预报的关系以及未来可能的发展阶段。

从2022年开始,以华为pangu weather为代表的气象大模型及fuxi、fengwu等相继涌现,公开发表的文章里也展示了模型与ec预报性能的对比,并且这些大模型也公开了相应的代码或模型,便于人人都可测试使用(如何在本地部署大模型可以参考如何在本地部署现有气象大模型_pip install ai-models-panguweather-优快云博客

)。

最近尝试对这些大模型尝试进行了相关研阅调研分析,以下是个人的几点思考,也欢迎各位老师专家批评指正(也可以直接看第八条):

首先,气象大模型在运行效率上的优势比较明显,哪怕穷人版GPU(我用的20年titan rtx)也仅需10多分钟即可实现未来10天全球25公里逐6小时不同等压层的rtuv预报。这与现在主流预报方式是不同的。

其次,从预报性能来说,各模型也都在文章里指出相较于ifs在mse、mae、rmse等方面的优势。因为模型本身在进行参数优化的时候都是以mse、mae、rmse作为loss,所以只要这个问题是可学习的(后面第八条我们讨论为什么可学习),那么模型在mse、mae、rmse指标上是可以达到局部最优的。

第三,我们从模型角度看,无论是pangu、fuxi、fengwu,都仍然是标准transform系列,所以如果对于计算机视觉方向的研究人员来说,模型方法的优势相对于CVPR、iccv等上面的文章吸引力反倒不足。

但是,第四点,不得不提的是,气象输入数据确实庞大,这在计算机视觉里的相关任务还是需要做很多研究工作。而且可以注意一点,大模型里习惯称不同的气象要素为不同的模态。

第五,其实对任意简单的深度学习模型(任意跟视频预测相关的),我们前期有相关实验发现模型性能也都可以,但做不到长序列,所以气象大模型非常让人眼前一亮的点就

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值