图卷积网络与本体概念对齐的研究进展
1. 集群约束图卷积网络
在图卷积网络(GCN)的研究中,为了提高Cluster - GCN的性能,研究人员提出了使用带有额外约束的Leiden算法。
1.1 社区合并与约束
为了实现网络社区合并过程的通用性并利用网络社区的多样性,社区 $C_j$ 以一定概率随机与社区 $C_i$ 合并,概率公式如下:
$Pr(C_i = C_j) \approx \frac{ER(C_i, C_j)}{\sum_{C_k\in(C - C_i)}ER(C_i, C_k)}$
同时,结合 $ct_{max}$ 和 $ct_{min}$ 两个约束条件,确保所有社区的大小都在 $[ct_{min}, ct_{max}]$ 范围内。为避免创建大于 $ct_{max}$ 的社区,上述概率公式需修改为:
$Pr(C_i = C_j) \approx
\begin{cases}
\frac{ER(C_i,C_j)}{\sum_{C_k \in(C - C_i)} ER(C_i,C_k)} & \text{if } |C_i + C_j| \leq ct_{max}\
0 & \text{otherwise}
\end{cases}$
1.2 重叠社区约束
社区检测通常会导致节点特征分布不均衡,为解决这一问题,提出了重叠约束 $ct_{overlap}$ 来平衡子图间的节点特征分布。
在ogbn - proteins数据集中,每个节点都有一个物种ID。假设 $f_{C}^i$ 是物种 $i$ 在社区 $C$ 中出
超级会员免费看
订阅专栏 解锁全文
1411

被折叠的 条评论
为什么被折叠?



