learning and transferring mid-level image representations using convolutional neural networks

该研究通过AlexNet在ImageNet训练集上预训练,然后进行参数迁移,保留前层参数,只训练新加入的适应层,以适应Pascal VOC2007等复杂数据集。使用滑动窗口策略选取正负样本,进行目标任务的微调。在测试阶段,生成heatmap实现分类与定位功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

cvpr14--Learning and transferring mid-level image representations using convolutional neural networks

Authors:Maxime Oquab1,Ivan Laptev,Leon Bottou, Josef Sivic.

论文理解 

1.贡献

文章是从transfer learning的角度来看看待特征学习,并不是像之前的方法比如R-CNN那样把最后的softmax输出节点个数改成相应数据集class的个数,然后调低学习率再做fine-funing(这种方法一般更恰当的叫法可能叫fine-tuning),这篇文章采用的是把softmax摘掉,重新加入一个fully connection layer--FCa和相应的softmax--FCb,在训练的时候保持前面的参数不变,只是学习FCa和FCb的参数;另比较有意思的是训练集的再加工,用到了尺寸信息,以及后面把heatmap的信息融合起来便于loacalization。文章claim出的分类效果比pascal 2007和pasc
### 关于 ImageNet 数据集的相关学术论文 ImageNet 是计算机视觉领域最著名的数据集之一,广泛应用于各种研究工作。以下是几篇重要的与 ImageNet 相关的学术论文: #### 1. 原始 ImageNet 论文 一篇开创性的论文介绍了 ImageNet 的构建及其在大规模图像识别中的应用[^4]。 ```plaintext @inproceedings{deng2009imagenet, title={Imagenet: A large-scale hierarchical image database}, author={Deng, Jia and Dong, Wei and Socher, Richard and Li, Li-Jia and Li, Kai and Fei-Fei, Li}, booktitle={2009 IEEE conference on computer vision and pattern recognition}, pages={248--255}, year={2009}, organization={Ieee} } ``` 这篇论文描述了如何创建一个大型层次化的图像数据库,并讨论了其在物体识别方面的潜力。 #### 2. 使用 ImageNet 进行深度学习模型训练的研究 另一项重要研究表明,在 ImageNet 上预训练的卷积神经网络可以显著提高其他任务上的性能[^5]。 ```plaintext @article{oquab2014learning, title={Learning and transferring mid-level image representations using convolutional neural networks}, author={Oquab, Maxime and Bottou, L{\'e}on and Laptev, Ivan and Sivic, Josef}, journal={Proceedings of the IEEE conference on computer vision and pattern recognition}, pages={1717--1724}, year={2014} } ``` 此研究展示了通过迁移学习方法利用 ImageNet 预训练模型的有效性。 #### 3. 对 ImageNet 挑战赛获胜算法的分析 每年举办的 ILSVRC(ImageNet 大规模视觉识别挑战赛)吸引了众多顶尖团队参与。有文章总结了历届比赛的关键技术和趋势变化[^6]。 ```plaintext @misc{kornblith2019better, title={Do Better ImageNet Models Transfer Better?}, author={Simon Kornblith and Jonathon Shlens and Quoc V. Le}, year={2019}, eprint={1805.08974}, archivePrefix={arXiv}, primaryClass={cs.CV} } ``` 这些文献不仅涵盖了 ImageNet 自身的发展历程,还反映了它对整个计算机视觉社区的影响和发展方向。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值