EfficientNet 测试

本文介绍了在GPU环境下使用EfficientNet PyTorch实现的性能测试。针对torch1.10版本,EfficientNet-b0在1070 GPU上,batch_size为1时需要25ms,而batch_size为4时则增加到56ms。对于更大batch_size,内存可能会溢出。同时提到了其他实现和资源链接。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

需要torch1.10版本

最快的需要25ms gpu

https://github.com/zsef123/EfficientNets-PyTorch

还有这个:

https://github.com/jacke121/efficientnet-pytorch

1070上:efficientnet-b0

512 batch_seze 1需要25ms, 4需要56ms,batch_size为6就内存溢出

416 batch_seze 1需要25ms, 4需要56ms,batch_size为10就内存溢出

proxyless_gpu batch_size 20 可以,再大就不行了。

    def test():
        x = torch.FloatTensor(4, 3, 512, 512).cuda()

 
    w, d, _, p = efficientnet_params('efficientnet-b0')
    # note: all models have drop connect rate = 0.2
    blocks_args, global_params = efficientnet(width_coefficient=w, depth_coefficient=d, dropout_rate=p)


                                我还整理了更多Python的学习资料

                                      QQ  688244617
 
                                         免费自取

                               群里还有其他小伙伴可以一起学习交流
    model=EfficientNet(blocks_args, global_params)
    model.cuda()
    model.eval()
    for i in range(2000):
        t1 = time.time()
        out3= model(x)
        # print(out3)
        cnt = time.time() - t1
        print(cnt, out3.size())
 
if __name__ == '__main__':
 test()

https://github.com/lukemelas/EfficientNet-PyTorch/blob/master/efficientnet_pytorch/model.py


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值