Cross-domain Collaboration Recommendation
ACM-Jie Tang,Sen Wu,Jimeng Sun,Hang Su-2012
思路
跨域协作与传统的RS不同,主要不同之处有三:一是稀疏连接;二是互补的专业知识;三是主题偏斜。选择的研究对象是:出版物中的跨域合作数据。
本文提出CTL(Cross-domain Topic Learning)来解决这三个问题:为处理一,CTL通过主题层而不是作者层来整合现有的跨域协作,这解决了稀疏问题;为处理二,CTL的主题分布从源和目标域分开,以及域之间的相关性;为处理三,CTL只对跨域协作的相关主题进行建模。(并不是所有领域之间会有跨域协作,大概只有9%,所以我们应该专注于更好地建模那些具有高概率的跨域协作的主题)
虽然跨域协作面临的挑战是非常大的,但一旦成功形成这种跨域合作,影响通常是巨大的。在研究中发现,跨域协作在所哟可能的协作中只占一小部分。随着社会发展,跨域协作的趋势正逐渐增长,这证实了跨域协作的潜在需求。
CTL模型
CTL是一种生成式主题模型。它可以将跨域协作的相关主题与其他主题区分开来。最后将CTL集成到一个大规模的Web应用程序中,用于推荐跨域的研究和作者。
假设两个域:源域和目标域。目标是从源域中给目标域中的特定用户推荐潜在协作者。
G={V,E,X},|V|=N,E的维度是VV,一个表示用户之间无向关系的集合,X是Nd属性矩阵,每行对应于用户的属性值的向量,用xj表示第j个属性。
假设每个用户vi都与d个属性关联。
用户的主题属性多项式分布为