Network Embedding:网络嵌入方法
旨在学习网络中节点的低维度潜在表示,所习得的特征表示可以用作基于图的各种任务的特征(如:分类、类聚、链路预测和可视化)
Network Embedding的介绍
在整个网络上执行复杂推理过程非常困难,由于信息网络包含数十亿个节点和边缘,故提出:网络嵌入方法。
NE的中心思想:找到一种映射函数,该函数将网络中的每个节点转化为低维度的潜在表示
NE的特征:
适应性(adaptability):新的算法
可扩展性(scalability):网络嵌入算法应能在短时间内处理大规模网络
社区感知(community aware):要求同质网络泛化
低维(low dimensional):标记数据缺失时,低维模型可以更好地推广并加速收敛和推理
持续(continuous):模拟连续空间中的部分社区成员资格
NE简史
1.graph embedding:是一个降维的过程,主要方法包括:分析(PCA)和多维放缩(MDS),所有方法可被理解为运用一个n*k的矩阵来表示原始n*m矩阵,其中k<<n
2.早期提出的两种降维方法:IsoMap(等度量映射)和LLE(局部线性嵌入) 【保持非线性流形的整体结构,这些方法在小型网络上提供了良好的性能,但由于这些方法的时间复杂度至少是二次的,这使得它们无法在大规模网络上运行】
LLE:被称为局部模型,只关注样本点和邻居们的关系。局部线性嵌入试图保持邻域内样本之间的线性关系
ISOMAP:全局模型,MDS的一个变种。利用流形在局部上和欧式空间同胚这个性质,对每个点基于欧式距离找出其邻近点,建立近邻连接图(近邻点之间存在连接,非近邻点之间不存在),所以计算两点之间的地线距离问题转化成为计算近邻点连