GPU的程序kill后未释放内存

最新推荐文章于 2024-08-03 17:47:56 发布

Hansry

最新推荐文章于 2024-08-03 17:47:56 发布

阅读量1.2k

点赞数

CC 4.0 BY-SA版权

分类专栏： Tensorflow/Pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Hansry/article/details/83056729

Tensorflow/Pytorch 专栏收录该内容

7 篇文章

订阅专栏

本文揭示了PyTorch中使用DataLoader进行数据读取时的假多线程现象，实际上是通过多个子进程来模拟多线程工作。文章详细解释了在程序结束后，子进程占用的GPU显存不会自动释放的问题，并提供了手动清理僵尸进程的具体步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

使用PyTorch设置多线程（threads）进行数据读取（DataLoader），其实是假的多线程，他是开了N个子进程（PID都连着）进行模拟多线程工作，所以你的程序跑完或者中途kill掉主进程的话，子进程的GPU显存并不会被释放，需要手动一个一个kill才行，具体方法描述如下：

1.先关闭ssh（或者shell）窗口，退出重新登录

2.查看运行在gpu上的所有程序：

fuser -v /dev/nvidia*

3.kill掉所有（连号的）僵尸进程

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。