基于知识系统技术的图像检索:基础与应用
在图像检索领域,基于知识的系统技术正发挥着越来越重要的作用。本文将深入探讨图像检索中基本形状和复合形状的表示、语义解释,以及相关的推理和检索算法。
1. 基本形状与复合形状的表示
基本形状用字母 B 表示,具有边缘轮廓 e(B),且 e(B) 被描述为一个二维封闭曲线,其空间原点与 B 的质心重合。常见的基本形状包括圆形、矩形等,任何完整的粗略轮廓也可视为基本形状。为了使语言具有组合性,我们仅考虑区域的外部轮廓。
可能的变换包括旋转(绕形状质心)、缩放和平移,我们将这些变换统一记为 r。变换可以按顺序组合,形成一个数学群。
语法的基本构建块是基本形状组件 (c, t, r, B),它表示一个具有颜色 c、纹理 t 和边缘轮廓 r(e(B)) 的区域。例如,r 可以指定将轮廓 e(B) 放置在图像的左上角,缩放为原来的 1/2 并顺时针旋转 45 度。
复合形状描述是基本形状组件的合取,每个组件都有自己的颜色和纹理。例如,“点燃的蜡烛” 这个复合形状可以定义为:
lighted - candle = (C1, t1, r1, rectangle) ∩ (C2, t2, r2, circle)
其中 r1 和 r2 将圆形放置在矩形上方作为火焰,纹理和颜色根据直觉定义。
2. 语义解释
我们采用外延语义,将语法表达式解释为某个域的子集。在我们的设定中,解释域是一组图像 Γ,形状和组件被解释为 Γ 的子集。因此,图像数据库也是一个解释域,复杂形状 C 是该域的一个子集,即当 C 作为查询时从数
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



