图分类中结构方法与嵌入方法的比较
1. 引言
结构模式识别是一个自80年代初诞生的研究领域。在过去30年里,像图这样的结构通过直接使用节点和弧上属性值的函数优化来进行比较。然而,在过去十年中,核方法和嵌入方法出现了。这些新方法通过将图表示到多维空间中,推导出节点之间的相似度值和最终标签。近年来,核方法和嵌入方法似乎比经典的结构方法更受青睐,但这两种方法都有优缺点。
经典的图模式识别方法依赖于在图域中计算图之间的距离,即通过直接优化考虑节点和边属性的目标函数来获取两个图之间的距离。但在图域中,这些距离无法在多项式时间内计算,因此自80年代以来开发了大量的近似算法。
模式识别应用通常需要依赖图类原型来表示数据集。这些原型的合成通常采用顺序或层次合成的方式,以迭代的形式构建图原型。不过,这种经典模型存在一些缺点,例如如果模型在初始步骤不能捕获全局信息,可能会导致生成的模型不佳,从而降低应用的性能。为克服这一缺点,可以采用新的原型合成方法,如通用标签解决方案。
近年来,传统的图原型逐渐被图嵌入和核方法所取代。图嵌入和核方法的基本思想是将图编码为向量,对应多维向量空间中的一个点。它们的主要区别在于嵌入的方式。图嵌入知道目标空间和变换函数,通过将图转换为向量来显式地进行嵌入,然后直接在目标向量空间中的向量上应用相似度/距离/相异度函数。而图核方法则将初始向量表示嵌入到更大的向量空间中,这个目标空间通常是未知的,但通过核技巧,可以使用图的初始向量表示之间的点积来计算目标空间中的距离。
然而,图嵌入和图核方法也有一些缺点。一是它们通常依赖于图的非完整表示,如某些矩阵或核,可能会为了速度而牺牲性能;二是在需要使用或表示图信息时,展开嵌入的过程可能非常困难,甚至不可能
图分类中结构与嵌入方法对比
超级会员免费看
订阅专栏 解锁全文

4194

被折叠的 条评论
为什么被折叠?



