基于知识系统的图像检索技术与应用
1. 引言
视觉语言基本可分为两大类:一类是为视觉表示提供形式化方法的语言,另一类是用于视觉编程的语言。前者能对图像或图形对象等视觉信息进行逻辑解释;后者则支持对传统数据类型进行视觉表示,为系统提供更面向用户的界面。
这里采用第一种方法,定义了一种用于在图像知识库中定义图形对象和进行视觉查询的语言。在定义该语言时,使用逻辑形式化方法而非基于语法的方法,因为这样能增强语义在图像内容推理中的重要性。
此语言由定义语言和查询语言组成,二者均基于知识表示(KR)方法的描述技术来定义。该方法是声明式的,定义了一种基于草图的语言,其语法和语义源于描述逻辑(DL),这是一类用于知识表示的逻辑形式化方法。像其他知识表示形式化方法一样,它具备表达知识片段的语法、语义(DL的语义通常是模型论的),以及一组从断言表达式中推断隐式知识的推理服务。
在这种定义下,从语法和语义层面都需要对图像有集合论的观点。这有诸多优点:该语言是组合式的,能对对象进行结构化表示;可以对空间表示组件进行逻辑推理;语法转换在语义上是合理的;该方法实现了一个合理且完整的算法,能执行基于知识环境中典型的推理服务,如包含(即查询包含)、识别、检索和分类等。此外,还能进行复杂服务,如查询推理(包含性和空性)。这些服务可通过相似度度量用于精确匹配和近似匹配。
与其他方法一样,从通过图像分析提取的低级特征入手,来检测和刻画图像中的区域。但与基于特征的方法不同,所提供的语法允许将分割后的区域描述为基本对象,将复杂对象描述为基本对象的组合。
知识表示方法在图像检索研究中的主要优势可总结如下:
1. 它将为图像检索查询语言寻找直观语义的问题,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



