
收录于IJCAI2022 的论文Investigating and Explaining the Frequency Bias in Image Classification (链接:https://www.aminer.cn/pub/6278861f5aee126c0f071c6c/?f=cs)探究和解释了图像分类任务中存在的频域偏见。图像分类是计算机视觉中最基础的一个任务,也是几乎所有的基准模型进行比较的任务。从最开始比较简单的10分类的灰度图像手写数字识别任务mnist,到后来更大一点的10分类的 cifar10和100分类的cifar100任务,到后来的imagenet任务,图像分类模型伴随着数据集的增长,一步一步提升到了今天的水平。现在,在imagenet这样的超过1000万图像,超过2万类的数据集中,计算机的图像分类水准已经超过了人类。
可见,图像分类在计算机视觉有着重要地位。AMiner整理了关于图像分类的论文合集,点击链接查看:https://www.aminer.cn/topic/600a813592c7f9be21328877?f=cs
以下是从论文集中挑选的几篇优质论文,供大家学习:
1.Res2Net: A New Multi-Scale Backbone Architecture
“在本文中,我们提出了一种新颖的CNN构建块,即Res2Net,方法是在单个残差块中构建分层残差状连接。Res2Net 在粒度级别表示多尺度特征,并增加了每个网络层的接受字段范围…”

这篇博客汇集了关于图像分类的高质量论文,包括Res2Net的多尺度架构、挤压和激励网络的通道关系建模、正则化进化在架构搜索中的应用、可微分的架构搜索技术DARTS、针对移动设备的Mnasnet优化以及EfficientNet的模型缩放方法。这些研究展示了如何提升计算机视觉中图像分类的性能和效率。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



