用于图网络的传统机器学习方法（CS224W课程笔记)

最新推荐文章于 2024-11-07 10:33:23 发布

SsR.XX

最新推荐文章于 2024-11-07 10:33:23 发布

阅读量1.5k

点赞数

分类专栏：课程笔记文章标签：机器学习算法图论

本文链接：https://blog.youkuaiyun.com/chacha_/article/details/123447884

版权

课程笔记专栏收录该内容

1 篇文章

订阅专栏

本文介绍了图网络中结点级、边级和图级的特征，包括结点的度、中心性（特征向量中心性、中介中心性和接近中心性）、聚类系数、非同构子图（Graphlets）以及边级的最短路径距离、局部和全局公共邻居。此外，还讨论了图级的Graphlet kernel和WL kernel两种核方法。这些特征和度量在图数据的分析和机器学习任务中起着关键作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

这节课讲述了图网络的传统机器学习方法，包括结点级、边级、图级特征的设计。
课程网址：http://web.stanford.edu/class/cs224w/index.html

一、结点级特征（Node-level Features）

结点的度（Node degree）
结点的中心性（Node centrality）
聚类系数（Clustering coefficient）
非同构子图（Graphlets）

1. 结点的度（Node Degree）

结点 $v$ 的度 $k_v$ 是该节点拥有的边数。
在这里插入图片描述

2. 结点的中心性（Node Centrality）

2.1 特征向量中心性（Eigenvector Centrality）

结点v的中心性是其邻居结点u的中心性的总和：
$c_v = \frac{1}{\lambda} \sum_{u \in{N(v)}}{c_u}$
将上述迭代方程写成矩阵的形式：
$\lambda c = Ac$
其中，A是邻接矩阵， $\lambda$ 取A的最大特征值。

2.2 中介中心性（Betweenness Centrality）

在这里插入图片描述

2.3 接近中心性（Closeness Centrality）

在这里插入图片描述

3. 聚类系数（Clustering Coefficient）

本质上就是自我中心网络（ego-network）的三角形的个数
在这里插入图片描述

4. 非同构子图（Graphlets）

两个图同构通俗来讲就是：拥有相同数目的结点，并且以相同的方式连接。
在这里插入图片描述
n个结点构成的Graphlets的个数随n呈指数增长：

如图，2-node graphlets 有1个，3-node graphlets 有3个，4-node graphlets 有11个，5-node graphlets 有58个。注意：这里的Graphlets要求图是连通的