EfficientNet 测试

最新推荐文章于 2025-05-25 10:25:24 发布

程序员lamed

最新推荐文章于 2025-05-25 10:25:24 发布

阅读量871

点赞数

CC 4.0 BY-SA版权

文章标签： Python 程序员编程新手入门

本文链接：https://blog.youkuaiyun.com/weixin_45342712/article/details/96131416

本文介绍了在GPU环境下使用EfficientNet PyTorch实现的性能测试。针对torch1.10版本，EfficientNet-b0在1070 GPU上，batch_size为1时需要25ms，而batch_size为4时则增加到56ms。对于更大batch_size，内存可能会溢出。同时提到了其他实现和资源链接。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

需要torch1.10版本

最快的需要25ms gpu

https://github.com/zsef123/EfficientNets-PyTorch

还有这个：

https://github.com/jacke121/efficientnet-pytorch

1070上：efficientnet-b0

512 batch_seze 1需要25ms， 4需要56ms，batch_size为6就内存溢出

416 batch_seze 1需要25ms， 4需要56ms，batch_size为10就内存溢出

proxyless_gpu batch_size 20 可以，再大就不行了。

    def test():
        x = torch.FloatTensor(4, 3, 512, 512).cuda()

 
    w, d, _, p = efficientnet_params('efficientnet-b0')
    # note: all models have drop connect rate = 0.2
    blocks_args, global_params = efficientnet(width_coefficient=w, depth_coefficient=d, dropout_rate=p)


                                我还整理了更多Python的学习资料

                                      QQ  688244617
 
                                         免费自取

                               群里还有其他小伙伴可以一起学习交流
    model=EfficientNet(blocks_args, global_params)
    model.cuda()
    model.eval()
    for i in range(2000):
        t1 = time.time()
        out3= model(x)
        # print(out3)
        cnt = time.time() - t1
        print(cnt, out3.size())
 
if __name__ == '__main__':
 test()