-
方法简介
论文的模型旨在学习两个高维分布之间的双向非线性投影。模型由三个部分组成:编码网络、生成网络和鉴别网络,如图2所示:
编码网络EEE的输入是维度为VVV的文档表示dr→\overrightarrow{d_{r}}dr,输出是维度为KKK的主题分布θr→\overrightarrow{\theta _{r}}θr,VVV和KKK分别表示单词数和主题数。
生成网络GGG的输入是从迪利克雷先验随机抽出的主题分布θf→\overrightarrow{\theta _{f}}θf,输出是维度为VVV的伪单词分布df→\overrightarrow{d_{f}}df。
鉴别网络DDD的输入是真实分布Pr→=[θr→;dr→]\overrightarrow{P _{r}}= \left [ \overrightarrow{\theta _{r}};\overrightarrow{d_{r}}\right ]Pr=[θr;dr]和伪分布Pf→=[θf→;df→]\overrightarrow{P _{f}}= \left [ \overrightarrow{\theta _{f}};\overrightarrow{d_{f}}\right ]Pf=[θf;df