Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation[J]. Journal of machine Learning research, 2003, 3(Jan): 993-1022.
- Latent dirichlet allocation 是发表于2003年的一篇非常经典的工作,该方法名称可以简写为LDA,当然我这里看这一篇论文不是为了学习LDA,而是为了想要研究下LDA是如何用于社交网络的用户推荐任务上。
- 我们知道LDA可以用来对文档进行主题挖掘,他原始的假设就是如果一个作者要写一篇文章,那么作者首先会去确定一下这篇文章的一个或者几个主题,然后才会去写文章。同样的,对于社交网络来说,用户A关注用户B可能也是因为某一种主题兴趣才会去关注。这个时候,我们是否可以把用户A的所有关注者们当成一篇文档向量来进行表示,进而挖掘出用户A关注的那些用户的兴趣主题分布是什么,同时我们是否可以利用LDA来得到兴趣主题分布下有哪些被关注者呢?答案是可以的!这两个分布我们都可以得到!依此,我们可以计算出用户A可能会关注其他用户的一个概率值,选择概率得分最高的几个用户来对用户A进行一个社交网络用户的TOPN推荐工作。
- 类似的,LDA用于用户推荐的工作都可以分为两个步骤,一个是主题挖掘,一个是用户推荐。