《个性化问答系统中的主题模型评分方法及立陶宛议会演讲作者归属特征探索》
1. 个性化问答系统的主题模型评分方法
1.1 潜在狄利克雷分配(LDA)
LDA的工作流程如下:
1. 对于每个文档d,基于狄利克雷参数α的多项分布,为隐藏主题的分布抽取一个参数θ。
2. 对于每个文档集D,学习给定主题下单词分布的参数β。对于每个主题z,基于狄利克雷参数η的多项分布抽取向量βz。
3. 生成文档i中的第j个单词wi,j:
- 基于参数为θi的多项分布抽取一个主题zi,j。
- 基于参数为φzi,j的多项分布抽取单词wi,j。
其结构可以用如下mermaid流程图表示:
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
A(文档d):::process --> B(抽取参数θ):::process
C(文档集D):::process --> D(学习参数β):::process
D --> E(抽取向量βz):::process
B --> F(抽取主题zi,j):::process
E --> G(抽取单词wi,j):::process
F --> G
1.2 相关工作
已有少数问答系统使用了主题建模。与本研究最接近的工作提出了基于LDA的问答相似度度量方法。该方法通过问题和候选答案的主题分布相似度,以及给定每个
个性化问答与演讲作者归属研究
超级会员免费看
订阅专栏 解锁全文
1157

被折叠的 条评论
为什么被折叠?



