图像语义提取:从低级到中级表示的探索
在图像分析领域,语义提取是一项关键任务,它旨在从图像中获取有意义的信息,以便更好地理解和描述图像内容。本文将深入探讨图像语义提取的相关方法,特别是基于低级和中级表示的隐式知识利用。
低级表示中的隐式知识
在图像的低级表示中,隐式知识的利用主要分为两种方法:低级特征学习和单词/图像联合分布学习。
低级特征学习
图像分类问题常通过计算低级特征(如颜色和纹理)来解决。这些特征经过分类器处理,以推断图像的高级信息。这种方法认为图像类别可由其颜色和纹理属性直接描述,适用于基于场景的分类。例如,森林场景有高度纹理化的区域(树木),山区场景有大量蓝色(天空)和白色(雪),而直线水平和垂直边缘表示城市场景。
近年来的研究主要分为两种趋势:
- 全局 :图像中的对象或场景由从整个图像计算的低级特征描述。
- 局部 :图像先被划分为多个块或区域,然后从每个块或区域提取特征。
以下是一些代表性的判别和/或生成方法:
- 基于全局图像表示的场景分类语义提取 :在低级表示之上应用判别分类器,如支持向量机(SVM)分类器在视觉分类任务中表现出良好效果。有研究使用全局特征为每个图像生成一组带有一定置信度的语义标签,通过手动标记训练图像并使用SVM训练多个分类器,对测试图像进行分类并分配置信分数。这种方法对基于内容的图像检索(CBIR)结合相关性反馈(RF)系统特别有用。
- 支持局部表示的方法 :先将图像分割为子区域,独