图核、图挖掘与图形模型的深入解析
1. 图核(Graph Kernels)
1.1 动机与背景
核方法是一类机器学习算法,可应用于定义了有效(即正定)核函数的任何数据集。许多核方法在统计学习理论中有着坚实的理论基础,并且在许多现实世界的学习问题中表现出良好的预测性能。
1.2 图之间的核方法
- 理想属性 :对于非同构的图 (G) 和 (G’),函数 (k(G, \cdot)) 和 (k(G’, \cdot)) 不应等价。若不满足此属性,距离只是伪度量而非度量,即非同构的图可能会被映射到特征空间中的同一点,核方法将无法区分这两个图。然而,计算满足此属性的图核至少与解决图同构问题一样困难。
- 特殊用途的核 :针对各种类型的图,已经定义了特殊用途的核,例如针对路径(字符串核)和树的核。这些核通常定义为两个对象共有的模式数量,或者是在特征空间中计算特定模式出现次数的内积。但计算基于子图同构的图核(模式为所有连通图、所有循环或所有路径)是 NP 难的。
- 应对计算难题的技术 :
- 限制考虑的模式 :例如,将模式大小限制为常数。不过,由此得到的图核是否可行并不明确。
- 限制考虑的图类 :例如,只考虑树或小图。这种方法允许固定参数可处理的图核,但运行时间要求通常仍然很高。不过,在小分子的现实数据库中枚举循环是可行的。
- 重新定
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



