模糊描述逻辑在图像语义提取中的应用
1. 引言
语义图像分析一直是研究人员面临的挑战,旨在缩小自动提取的视觉内容描述与人类赋予的意义之间的语义差距。近年来,统计学习方法受到了更多关注,如支持向量机(SVMs)和贝叶斯网络(BNs),它们能有效发现、捕获和管理感知特征与语义概念之间的复杂关联。
然而,这些方法的性能会因处理的概念数量和图像数据集的不同而有显著差异。这主要是因为计算机视觉中的核心挑战,如语义上不同概念的感知相似性、单个概念可能表现形式的感知变化,以及假设语义可以通过视觉方式呈现的内在限制。这些问题导致学习到的关联不一定能反映预期的语义,常常出现不完整和冲突的分类情况。
为了弥补统计学习方法在语义利用上的不足,结合显式语义的协同方法成为了系统研究的主题。语义网的发展促使人们更多地使用语义网语言和描述逻辑(DLs),并提出了许多多媒体本体和领域本体,以实现从低级特征到语义实体的转换,并通过推理获取更高抽象层次的解释。
但目前的方法往往忽略了统计学习中语义利用不佳带来的影响,如提取描述中的不确定性和语义不一致性。提取的分类通常被视为明确的断言,忽略了描述的可信度信息,并且大多假设提取的描述在语义上是连贯的。
为了提高语义利用率,本文提出了一个基于模糊描述逻辑(DLs)的推理框架,用于将分类器的输出解释为语义一致的结果。该框架的贡献包括:
- 正式处理并考虑学习方法提供的描述的不确定性。
- 识别并解决由于感知特征与语义关联学习的局限性导致的冲突描述中的不一致性。
- 除了在多个可能解释中获取最合理的解释外,还支持识别初始描述中可能遗漏概念的图像区域。
超级会员免费看
订阅专栏 解锁全文
1060

被折叠的 条评论
为什么被折叠?



