Facebook、Twitter、微信、微博等社交和信息网络活动已经成为我们日常生活中不可或缺的一部分,在这些活动中,我们可以很容易地了解朋友的行为,进而受到他们的影响。因此,对每个用户进行有效的社会影响力预测对于各种应用(如在线推荐和广告)至关重要。
传统的社会影响预测方法通常会设计各种手工制作的规则来提取特定于用户和网络的特征。然而,它们的有效性很大程度上依赖于领域专家的知识。因此,通常很难将它们归纳到不同的领域。受deep神经网络最近在广泛的计算应用中取得成功的启发,我们设计了一个端到端的框架DeepInf,以学习用户的潜在特征表示来预测社会影响力。一般来说,DeepInf将用户的局部网络作为图神经网络的输入,以学习其潜在的社会表征。我们设计策略将网络结构和用户特定特征结合到卷积神经网络和注意力网络中。在开放学术图、Twitter、Weibo和Digg(代表不同类型的社交和信息网络)上进行的大量实验表明,所提出的端到端模型DeepInf的性能明显优于传统的基于特征工程的方法,表明了表征学习在社交应用中的有效性。
关键字:表征学习;网络嵌入;图卷积;图形注意;社会影响;社会网络
引言
社会影响无处不在,不仅存在于我们的日常生活中,也存在于虚拟的网络空间中。社会影响一词通常指的是一个人的情绪、观点或行为受到他人影响的现象。随着在线和移动社交平台的全球渗透,人们已经见证了社会影响力在各个领域的影响,比如总统选举[7]、广告[3,24]和创新采纳[42]。迄今为止,毫无疑问,社会影响已经成为一种普遍而复杂的力量,推动着我们的社会决策,显然需要方法来描述、理解和量化社会影响的潜在机制和动态。
事实上,文献[26,32,42,43]中已经对社会影响预测做了大量工作。例如,Matsubara等人。[32]通过精心设计从经典的“易感感染”(SI)模型扩展而来的微分方程,研究了社会影响的动力学;最近,Li等人。[26]提出了一种结合递归神经网络(RNN)和表征学习来推断级联规模的端到端预测器。所有这些方法的主要目的是预测社会影响的全局或聚合模式,例如在一个时间范围内的级联规模。然而,在许多在线应用中,如广告和推荐,对每个个体的社会影响力进行有效的预测,即用户层面的社会影响力预测是非常关键的。
本文主要研究用户层面的社会影响力预测。我们的目的是预测一个用户的动作状态,并给出其邻近邻居的局部结构信息。例如,在图1中,对于中心用户v,如果她的一些朋友(黑圈)购买了一个产品,她将来会购买同样的产品吗?上面提到的问题在实际应用中很普遍,但它的复杂性和非线性却经常被观察到,例如[2]中的“s形”曲线和[46]中著名的“结构多样性”。以上观察启发了很多用户级影响预测模型,其中大多数[27,53,54]考虑了复杂的手工制作的特征,这些特征需要对特定领域有广泛的了解,通常很难推广到不同的领域。
图1:社会影响区域预测的一个激励性例子。我们的目标是预测v的动作状态。假设1)观察到的近邻居的行为状态(黑色和灰色圆圈分别表示“活跃”和“不活跃”),以及2)她嵌入的本地网络。
受最近神经网络在表征学习中的成功启发,我们设计了一种端到端的方法来自动发现社会影响中的隐藏和预测信号。通过将网络嵌入[37]、图卷积[25]和图注意机制[49]构建到一个统一的框架中,我们期望端到端模型能够比传统的特征工程方法获得更好的性能。具体地说,我们提出了一个基于深度学习的框架DeepInf,将影响动态和网络结构都表示为一个潜在空间。为了预测一个用户 v的动作状态,我们首先用restart随机游动【through random walks with restar】对她的本地邻居进行抽样。在获得如图1所示的局部网络之后,我们利用图卷积和注意力技术来学习潜在的预测信号。
我们在开放学术图(OAG)、Digg、Twitter和Weibo四个不同领域的社交和信息网络上展示了我们提出的框架的有效性和效率。我们将DeepInf与几种传统方法进行了比较,例如具有手工制作特征的线性模型[54]以及最先进的图形分类模型[34]。实验结果表明,DeepInf模型能显著提高预测性能,为社会和信息网络挖掘任务提供表征学习的前景。
本文的其余部分安排如下:第二节阐述社会影响预测问题。第三部分详细介绍了所提出的框架。在第4节和第5节中,我们进行了广泛的实验和案例研究。最后,第六节对相关工作进行了总结,第七节对本课题进行了总结。
问题表述
在这一部分,我们介绍了必要的定义,然后阐述了预测社会影响的问题。
定义2.1。 r-neighbors和r-ego network 设G =(V,E)是一个静态社交网络,其中V表示用户集和E⊆V×V表示关系集。 对于用户v,其r-neighbors被定义为其中d(u,v)是网络G中u和v的最短路径距离(就跳数而言) 用户v的r-ego network是由 Γrv 引起的子网络,由
表示。
定义2.2 社交活动 社交网络中的用户执行社交活动,例如转发。 在每个时间戳t,我们观察到用户u的二元动作状态, ∈0,1 ,其中 stu=1 表示用户u在时间戳t时刻或之前执行了此动作,并且
=0 表示用户尚未执行此操作。 这样的动作日志可以从许多社交网络获得,例如Twitter中的“转发”动作和学术社交网络中的引用动作。
在上述定义的基础上,我们引入了社会影响局部性,这相当于一种封闭世界假设:用户的社会决策和行为只受其在网络中的近邻的影响,而外部资源被假定不存在。
问题1:社交影响局部性 v的行动状态的概率取决于她的r-ego网络 和她的r-neighbors的行动状态。 更正式地,给定 Grv 和
,社会影响局部性旨在量化在给定时间间隔Δt之后v的激活概率:
实际上,假设我们有N个实例,每个实例是一个3元组(v,a,t),其中v是用户,a是社交动作,t是时间戳。 对于这样的3元组(v,a,t),我们还知道v的r-ego网络 Grv ,v的r-neighbors动作状态-