视觉理解的多种方法及应用
1. 视觉理解的基础概念
在视觉理解的过程中,我们会涉及到多个重要的概念和方法。首先,对于属于类别 (v) 中特定子类别 (v_i) 的对象 (o_i),我们可以为其获取一个符号名称 (\eta_i)。通过对所有属于 (v_i) 的对象进行这样的操作,我们就能得到该类别的视觉概念 (\phi(\nu) = {\eta_1, \eta_2, \ldots, \eta_n})。这个视觉概念在学习过程中形成,并在后续的理解过程中发挥重要作用。
当有一个新的对象 (o \in v) 来自特定类别 (v_i \in v) 被呈现时,如果它被认定为属于类别 (v) 中的对象,并且其符号名称 (\eta) 不在已有的视觉概念集合 (\phi(\nu)) 中,那么就会将这个符号名称 (\eta) 添加到集合中,即 (\phi(\nu) = \phi(\nu) \cup \eta)。在某些情况下,为了更好地表示这个新的视觉对象 (o),还需要推导出一个新的特定形状类。
2. 视觉理解 - 泛化
2.1 泛化的原理
泛化是视觉理解中的一种重要方法。下面以刀具类别 (K) 为例进行说明。假设刀具类别 (K = {k_1, k_2, k_3, k_4}),其中 (k_1)、(k_2)、(k_3) 已经按照特定方式学习过,并分别获得了符号名称 ({K}Q_1^4 M_2^{1,3}[L_5^T] )、({K}Q_1^4 M_2^{1,3}[L_5] ) 和 ({K}Q_1^4
超级会员免费看
订阅专栏 解锁全文
6万+

被折叠的 条评论
为什么被折叠?



