-
方法简介
论文的模型旨在学习两个高维分布之间的双向非线性投影。模型由三个部分组成:编码网络、生成网络和鉴别网络,如图2所示:

编码网络EEE的输入是维度为VVV的文档表示dr→\overrightarrow{d_{r}}dr,输出是维度为KKK的主题分布θr→\overrightarrow{\theta _{r}}θr,VVV和KKK分别表示单词数和主题数。
生成网络GGG的输入是从迪利克雷先验随机抽出的主题分布θf→\overrightarrow{\theta _{f}}θf,输出是维度为VVV的伪单词分布df→\overrightarrow{d_{f}}df。
鉴别网络DDD的输入是真实分布Pr→=[θr→;dr→]\overrightarrow{P _{r}}= \left [ \overrightarrow{\theta _{r}};\overrightarrow{d_{r}}\right ]Pr=[θr;dr]和伪分布Pf→=[θf→;df→]\overrightarrow{P _{f}}= \left [ \overrightarrow{\theta _{f}};\overrightarrow{d_{f}}\right ]Pf=[θf;df
Neural Topic Modeling with Bidirectional Adversarial Training
最新推荐文章于 2024-09-28 19:38:43 发布
该博客介绍了采用双向对抗训练的神经主题模型,包括编码网络、生成网络和鉴别网络的详细结构,以及高斯BAT的改进。模型通过Wasserstein-distance作为优化目标,旨在学习文档主题与单词分布之间的双向映射,适用于主题生成和文本聚类。

最低0.47元/天 解锁文章
1125

被折叠的 条评论
为什么被折叠?



