昇腾多卡910B服务器mindie推理报错显存不足npu out of memory，已解决

福小白

已于 2025-08-02 14:38:40 修改

阅读量357

点赞数 3

CC 4.0 BY-SA版权

文章标签：服务器运维

于 2025-06-25 11:15:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_38773993/article/details/148894816

1.报错场景
使用多张910B卡推理大模型时报错显存不足，8张卡远远足够用，说明不是因为模型参数太大导致的。NPU out of memory. Tried to allocate 88.00 MiB (NPU 1; 29.50 GiB total capacity; 28.30 GiB already allocated; 28.30 GiB current active; 29.59 MiB free; 29.50 GiB allowed; 28.88 GiB reserved in total by PyTorch)
2.解决方法
（1）关闭多余进程
npu-smi info，先看下有没有其它进程在用显卡，如果有的话，kill -9 掉对应的进程；
（2）修改显存配置
编辑mindie配置文件，/usr/local/Ascend/mindie/latest/mindie-service/conf/config.json。里面ModelConfig中有个参数npuMemSize，默认值是-1（代表无限制），把它改小点，比如8。
在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。