通用标签与中位数图之间的关系
1. 引言
在许多模式识别应用中,我们会得到同一对象的一组不同表示,目标是将这些表示总结为一个单一的表示。这个结果表示应捕捉对象的重要特征,同时摒弃噪声或意外的变化。当使用属性图进行表示时,这个图被称为广义中位数图,简称中位数图。给定一组训练图,中位数图被正式定义为一个图,它使到集合中所有其他图的成本总和最小。
如果假设顶点没有唯一标签,那么找到中位数图的问题在一般形式下,至少和在特定成本函数(如NP难问题的图编辑距离)下匹配两个图的问题一样困难。实际上,中位数图无法以封闭形式计算,因为它的合成依赖于它与给定图之间的匹配,而与中位数图的匹配显然需要先有中位数图。处理这个“鸡生蛋还是蛋生鸡”问题的常用方法是采用增量方法,即先粗略构建中位数图,然后迭代细化,直到考虑完训练集中的所有图。
另一种计算中位数图的方法是将匹配和合成过程分离。这种方法基于这样的假设:给定计算中位数图的顶点标签,在大多数应用中,它的计算可以在多项式时间内高效完成,例如对顶点和边的属性进行平均。这个方法可以总结为两个步骤:
1. 获得给定图之间的通用标签。通用标签的目标是在一些传递性限制下,最小化一组图之间的成对标签。
2. 一旦知道了这个信息,就可以轻松计算近似中位数图。
使用通用标签方法近似中位数图的主要优点是,中位数图直到过程结束才需要计算。这样,就不需要将初始图标签到中位数图,最初的“鸡生蛋还是蛋生鸡”问题也就消失了。虽然有实验表明使用通用标签计算中位数图能得到满意的结果,但到目前为止,通用标签问题和中位数图合成之间的正式关系一直缺失。在本文中,如果图匹配的成本是一个度量,我们将证明这两个问题紧密相关,因为可以使用通用标签值来界定中位数
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



