文章简介:
- 文章标题:
New binary linear programming formulation to compute the graph edit distance - 论文初稿链接
- 文章来源:2017 期刊 Pattern Recognition (文章是2015年的文章)
文章思路
精确计算GED是NP-Hard问题,需要的时间是指数级。因此,设定计算的GED的下限是十分必要的,可以在下界的基础上更加容易判定图GED。(这里的lower bound:不是过滤的意思,是指最小计算的运算量)文章以二进制数的线性规划问题,模拟了GED的计算过程,把计算成本的{0,1}的离散值分解为(0,1)区间的连续值。文中将编辑距离的六种操作都定义为取值为0或者1的变量:

并且给出了编辑距离的目标函数:

以及基于目标函数的约束条件:

三种约束:
- 顶点映射
- 边映射
- 考虑图的拓扑结构
基于约束条件,可以通过F1和F2求解:
F1:

F2:
文章缺点:
凡是计算GED的问题,都是通过计算编辑成本的方法。如,定义 d i s ( G 1 , G 2 ) dis(G_1,G_2) dis(G1,G2)= ∑ i = 0 p c o s t ( o p e r a t i o n ( i ) ) {\sum_{i=0}}^{p}cost(operation(i)) ∑i=0pcost(operation(i)),类似的成本公式,在公式中考虑到了顶点和边之间的六种操作。但是,编辑距离在度量相似度时候,不能考虑到顶点的结构信息,比如一个顶点的出度和入度信息,即拓扑信息。这是不精准的;另外一个方面,应该改变cost(operation)的权重,不应该设定统一的代价,因为每个操作的复杂情况根据其拓扑环境来讲是不同的。
本文介绍了一种使用二进制线性规划方法来计算图编辑距离(GED)的新技术,该方法将复杂的GED计算转化为更易于解决的优化问题。文章详细阐述了如何将GED的六种编辑操作转化为变量,并提出了一个目标函数及其约束条件,用于求解GED的下限。
3457





