Incorporating Word Correlation Knowledge into Topic Modeling

最新推荐文章于 2022-03-01 00:55:37 发布

Ayang777

最新推荐文章于 2022-03-01 00:55:37 发布

阅读量237

点赞数

分类专栏：话题模型

话题模型专栏收录该内容

26 篇文章

订阅专栏

本文探讨MRF-LDA模型，一种结合马尔科夫随机场(MRF)与潜在狄利克雷分配(LDA)的方法，用于提升话题模型中单词间语义一致性的识别。模型假设话题与单词分布遵循狄利克雷分布，通过MRF增强话题一致性，利用一元与二元势能优化话题分配。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

开始没有仔细看的时候，也不懂MRF的应用，学习细节才知道重点。

简单描述MRF-LDA的场景：首先，假设话题的粉笔θ，以及单词分布β都服从狄利克雷分布，每个单词具有话题标签z。提取单词的关联关系，主要是语义的相似性，用来学习话题的一致性。所以用到了MRF，在潜在话题层。给定文档d和N单词，判断单词对（根据外部知识）创建无向边连接他们的话题标签，获取图G和单词标签。如下图的5个节点，4条边(z1, z3), (z2, z5), (z3, z4), (z3, z5).，

有了图，然后利用MRF，即定义节点上的一元势能和边上的二元势能。其中一元势能即p(zi|θ)，话题多项分布；二元势能鼓励相似单词具有相似（相同）话题分配。

在MRF模型，所有话题分配的联合概率为：

变分推断的参数学习，略 IncorporatingWord <wbr>Correlation <wbr>Knowledge <wbr>into <wbr>Topic <wbr>Modeling

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。