https://github.com/Wulingtian/EfficientNetv2_TensorRT_int8/blob/master/effnetv2.py
测试代码:
if __name__ == '__main__':
import os
import time
model=EfficientNet(5)
model.cuda()
model.eval()
model_path = "dicenet.pth"
torch.save(model.state_dict(), model_path)
fsize = os.path.getsize(model_path)
fsize = fsize / float(1024 * 1024)
print(f"model size {round(fsize, 2)} m")
size=224
input = torch.rand(10, 3, size, size).cuda()
for i in range(15):
t1 = time.time()
loc = model(input)
cnt = time.time() - t1
print(cnt, loc.size())</

该博客介绍了EfficientNetv2的TensorRT整合测试,展示了不同模型尺寸和batch-size下的性能表现。在1060显卡上,224 batch支持10,而112 batch支持40,两者呈反向线性关系。文中提供了TensorFlow实现的EfficientNetv2模型参数,并给出了两个GitHub资源链接供参考。
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



