在目标检测、目标分割和目标跟踪等基本的视觉任务中,大多数backbone网络都是基于ImageNet上的分类任务进行开发的。虽然ImageNet比赛(ILSVRC)在2017年已经是最后一届了,但是除了比赛期间提出的经典网络,仍不断有新的深度神经网络模型涌现出来。为了在研究中更好地选择各种backbone模型,因而总结分析各种模型在精度、速度和内存等方面的对比情况,希望在实际应用中可以提供参考。
附上一个总结了机器学习paper及其开源实现的code的网站,其中包括对Computer Vision、Natural Language Processing、Medical等多个领域的上千个任务的分类,可以根据Greatest和Lastest进行筛选排序,很方便地了解各领域的进展。
Browse State-of-the-Art:https://www.paperswithcode.com/sota
目录
ImageNet 分类比赛模型(2012-2017)
ImageNet challenge分类结果评估
评价指标介绍:
Top1-accuracy:对一个测试图片,只有模型预测概率最大的类是正确的,才认为模型对该图片的预测正确。Top1准确率就是指预测正确的图片所占的比例。
Top5-error:对一个测试图片,如果模型预测概率最高的前五中包含正确答案,即认为模型对该图片预测结果正确。Top-5错误率就是指模型预测结果错误的图片的占比。
年份 | 网络 | Top1-accuracy | Top5-error |
---|---|---|---|
2012 | AlexNet | 63% | 15.32% |
2013 | OverFeat | —— | 14.18% |
2013 | ZFNet | —— | 13.51% |
2013 | Clarifai | —— | 11.20% |
2014 | VGG | 74% | 6.80% |
2014 | GoogleNet | —— | 6.67% |
2015 | ResNet | 82% | 3.57% |
2016 | ResNeXt | —— | 3.01% |
2016 | Trimps-Soushen | —— | 2.99% |
2017 | SENet | —— | 2.25% |
数据的参考链接:
[1]