- LSA latent semantic analysis
映射词-文档到一个低维隐语义空间
比较词和文档在低纬空间的相似性
- topic 是 Vocab 上的概率分布(符合多项式分布)
- 文档到主题的一个分布,主题到词库的分布,通过训练得到这两个分布模型
- plsa 模型
- LDA模型
- 大规模LDA系统
- spark LDA
- Google PLDA
- 微软LightLDA
- 腾讯LDA,PEACOCK
本文探讨了主题模型在自然语言处理中的应用,包括LSA、PLSA、LDA等模型的原理与实现。介绍了大规模LDA系统的几种实现方式,如SparkLDA、GooglePLDA、LightLDA及腾讯LDA(PEACOCK)。这些模型通过将词-文档映射到低维隐语义空间,比较词和文档在低维空间的相似性,从而实现主题发现。
映射词-文档到一个低维隐语义空间
比较词和文档在低纬空间的相似性
转载于:https://www.cnblogs.com/ChenAlong/p/5228329.html
7459

被折叠的 条评论
为什么被折叠?