不同抽象层次的视觉字母表与图嵌入技术
在当今的模式识别与计算机视觉领域,如何高效地处理和分析复杂的数据结构是一个关键问题。本文将介绍两种重要的技术:不同抽象层次的视觉字母表训练以及基于节点属性代表和词图表示的图嵌入方法。
不同抽象层次的视觉字母表训练
在对象识别系统中,训练模型需要考虑多个方面,包括视觉字母表、属性向量的噪声抑制参数以及生产规则的几何约束。对于几何约束与特征类型的重要性,不同的研究有不同的判断。为了充分考虑规则扩展深度的关键依赖关系,采用了差异化的训练过程。
- 终端元素
终端元素处于扩展的最深层次,代表不同方向的边缘片段、角点以及具有不同强度、直径和方向的均匀区域的中心点。通过对特征参数的量化区间进行优化,以试验分类任务中的信息内容为衡量标准,得到约1200个元素的终端字母表以及相应的噪声抑制非终结符。边缘和骨架化的双重整合拓宽了应用范围。 - 对象部分的非终结符
将上一步的非终结符组合成复杂的对象部分。根据特征共现的统计测量,空间邻近性对于特征组合的频率至关重要,因此更复杂视觉字母表的创建基于局部性原则。具体步骤如下:- 在样本图像中识别空间邻近的特征向量组。
- 对这些候选模式进行聚类,以获得具有高信息容量的紧凑部分字母表。每个模式由一个非终结符和相应的规则描述,相对特征位置由约束方程表示。
- 对于每个聚类,选择一个与聚类中其他所有模式兼容的模式纳入部分字母表。最终得到约5000个直径在10到60像素之间的模式的非终结符。
- 初始
超级会员免费看
订阅专栏 解锁全文
901

被折叠的 条评论
为什么被折叠?



