【Yolov5】RuntimeError: DataLoader worker (pid 25795) is killed by signal: Bus error.

最新推荐文章于 2024-12-18 10:59:39 发布

二十四桥下一句

最新推荐文章于 2024-12-18 10:59:39 发布

阅读量4k

点赞数 5

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签：深度学习 yolov5

本文链接：https://blog.youkuaiyun.com/lgh0824/article/details/111031681

深度学习专栏收录该内容

6 篇文章

订阅专栏

本文针对PyTorch DataLoader在多线程环境下出现Bus error的问题进行了详细分析，并提供了有效的解决方案，包括调整num_workers参数及提高Docker容器内的共享内存限制。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Traceback (most recent call last):
File "train.py", line 461, in <module>
train(hyp, opt, device, tb_writer)
File "train.py", line 271, in train
pred = model(imgs) # forward
File "/usr/local/lib/python3.8/dist-packages/torch/nn/modules/module.py", line 722, in _call_impl
result = self.forward(*input, **kwargs)
File "/usr/local/lib/python3.8/dist-packages/torch/nn/parallel/data_parallel.py", line 154, in forward
replicas = self.replicate(self.module, self.device_ids[:len(inputs)])
File "/usr/local/lib/python3.8/dist-packages/torch/nn/parallel/data_parallel.py", line 159, in replicate
return replicate(module, device_ids, not torch.is_grad_enabled())
File "/usr/local/lib/python3.8/dist-packages/torch/nn/parallel/replicate.py", line 113, in replicate
replica = module._replicate_for_data_parallel()
File "/usr/local/lib/python3.8/dist-packages/torch/nn/modules/module.py", line 1378, in _replicate_for_data_parallel
replica.__dict__ = self.__dict__.copy()
File "/usr/local/lib/python3.8/dist-packages/torch/nn/modules/module.py", line 775, in __setattr__
def remove_from(*dicts_or_sets):
File "/usr/local/lib/python3.8/dist-packages/torch/utils/data/_utils/signal_handling.py", line 66, in handler
_error_if_any_worker_fails()
RuntimeError: DataLoader worker (pid 25795) is killed by signal: Bus error. It is possible that dataloader's workers are out of shared memory. Please try to raise your shared memory limit.