社交关系提取的网络嵌入技术:TransNet算法详解
1. 背景与概述
在传统的网络嵌入(NE)模型中,通常简单地将每条边视为二进制或连续值来学习低维节点表示。然而,边包含着丰富的语义信息,顶点之间的交互往往具有独特的含义,而这些信息大多被现有模型所忽略。
社交关系提取(SRE)旨在对社交网络中的社会关系进行建模和预测,它与知识图谱(KG)中的关系提取任务类似,但存在明显差异。在KG中,关系类别通常是预先定义好的,并且关系事实经过人工精确标注;而在SRE中,社交网络顶点之间的关系是潜在的,通常隐藏在它们的交互文本中,且往往需要多个关系标签来表示复杂的关系。
现有的网络表示学习(NRL)和知识表示学习(KRL)方法无法很好地解决SRE问题。传统NRL模型在学习节点表示时忽略了边上的丰富语义信息,而典型的KRL模型如TransE仅在两个实体之间的关系被明确标注为单一标签时表现良好。为了解决这些问题,提出了一种基于翻译的新型NRL模型TransNet,将边上的多个关系标签纳入NRL中。
2. TransNet算法详解
2.1 问题形式化
SRE的目标是根据社交网络的整体结构和部分标注的边,预测未标注边的标签。假设存在一个社交网络 $G = (V, E)$,其中 $V$ 是顶点集,$E \subseteq (V \times V)$ 是顶点之间的边集,$E$ 中的部分边被标注,记为 $E_L$。对于每条标注边 $e \in E_L$,其标签集记为 $l = {t_1, t_2, \cdots}$,每个标签 $t \in l$ 来自一个固定的标签词汇表 $T$。SRE的任务就是预测未标注边集 $E_U = E - E_L$
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



