基于标签的场景图像分类语义特征研究
在计算机视觉领域,图像特征提取是一项关键任务,其方法的优劣直接影响到图像分类等任务的效果。传统的图像特征提取方法主要依赖图像的内容和结构信息,如颜色、纹理、形状等,但在处理具有类间相似性的模糊图像时,这些信息往往显得不足。本文将介绍一种基于网络上相似图像的标注/描述标签的新型语义特征提取方法,旨在提高场景图像分类的准确性。
传统方法的局限性
传统的图像特征提取方法主要分为三类:
1. 传统视觉特征 :基于SIFT、GIST、HOG等算法提取,依赖图像的颜色、强度等核心信息,通常在局部计算,属于低层次特征,适用于纹理图像等特定领域,但维度较高。
2. 深度学习特征 :从深度学习模型的中间层提取,不同层提供不同的语义信息,能够提取更具区分性的特征,在图像分类中取得了显著成功。
3. 基于标签的特征 :虽然有相关研究提出使用标签进行场景图像识别,但现有方法存在明显问题。例如,任务通用的滤波器组缺乏场景图像的上下文信息,而现有的基于标签的方法不设计滤波器组,导致特征维度高且存在明显的离群值,分类准确率有限。
提出的新方法
为了解决上述问题,本文提出了一种新的基于标签的语义特征提取方法,该方法主要包括两个步骤:
1. 滤波器组的设计
- 标签预处理 :使用Yandex搜索引擎提取数据集中每个图像的前50个视觉相似图像的标注/描述标签,然后对这些标签进行预处理,包括去除标点符号、数字、分词和语言翻
超级会员免费看
订阅专栏 解锁全文
18万+

被折叠的 条评论
为什么被折叠?



