ps. 文章较老,2010年的ECCV。虽然较早,确是大规模分类问题的起步性文章。后续引发了一大批衍生研究。本文预期将此问题的所有线索整理到位。
(红字表示绝对真实,蓝字表示推理真实)
这篇文章对1W个图像类别的分类问题进行了一系列实验,得出了4个重要的供后续研究的参考性结论:
1) computational issues become crucial in algorithm design
文中证据:
数据库大小:ImageNet 1W类别,900万张图片。
实验平台1:2.66GHz Intel Xeon CPU。
(模型学习时间)
--BOW+binary linear SVM(包含cross validation) LIBLINEAR
单个分类器训练为 1小时
1-vs-all 训练为 1CPU year,测试16小时(训练集与测试集按照50%划分)
1-vs-1 训练为 1CPU year,测试8年
(学习时所需内存)

本文探讨了在1万个图像类别上进行分类时遇到的计算问题,表明传统算法在大规模数据上的表现不再适用,并揭示了WordNet的语义结构与视觉分类难度的强相关性。实验结果显示,分类性能受数据集密度影响,利用语义层次可以提高分类效果。该研究对大规模图像分类算法设计和分布式学习提出了新的需求和启示。
最低0.47元/天 解锁文章
1465

被折叠的 条评论
为什么被折叠?



