torch.utils.data.DataLoader

最新推荐文章于 2022-12-07 23:23:50 发布

小李飞刀李寻欢

最新推荐文章于 2022-12-07 23:23:50 发布

阅读量609

点赞数 1

CC 4.0 BY-SA版权

分类专栏： python

本文链接：https://blog.youkuaiyun.com/SPESEG/article/details/103711315

python 专栏收录该内容

297 篇文章 ¥399.90 ¥499.90

订阅专栏

超级会员免费看

本文纠正了之前关于workers参数的误解，它用于控制数据加载的进程数，影响数据读取速度。官方解释指出，0表示单进程，大于0表示多进程。设置为True可能导致CUDA内存占用问题。通过尝试设置False，发现GPU利用率低。实验设置为-j 24，但发现锁页内存配置复杂，希望有更简单的解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

关于workers，上一篇可能有误。

经查，表示进程之义。0表示只有主进程，大于0的表示多个进程，加快数据读取。

下面是官方解释，估计也没人看官方源码吧

num_workers (int, optional): how many subprocesses to use for data
            loading. ``0`` means that the data will be loaded in the main process.
            (default: ``0``)

上一篇cuda占满的原因还是另一个参数，这个设置为True

pin_memory (bool, optional): If ``True``, the data loader will copy Tensors
            into CUDA pinned memory before returning them.  If your data elements
            are a custom type, or your :attr:`collate_fn` r

了解本专栏