在线评论情感分析与语义意见检索技术
1. ARO 模型在情感分析中的应用
1.1 ARO 模型参数设置
在在线评论的情感分析中,ARO 模型具有八个 Dirichlet 先验参数,这些参数会影响 Gibbs 采样的收敛性,但对输出结果影响不大。一般在所有实验中,我们设置 $\alpha_e = 0.1$,$\alpha_u = 0.1$,$\alpha_o = 0.1$,$\beta = 0.05$,$S = 3$ 以及 $\eta = 0.5$。对于其余超参数 $\gamma_e$,$\gamma_u$ 和 $\gamma_o$,在正情感标签下设置为 0.01,在负情感标签下设置为 5。
1.2 情感先验的定义与整合
实验中选择了两个词典:MPQA 主观性词典和过滤后的 MPQA 主观性词典,这两个词典都曾在 JST 中使用。
1.3 情感分类
文档情感分类基于 $p(l|d)$,通过公式 5 进行近似计算。在实验中,仅考虑给定文档的正、负标签概率。同时,我们遵循 B. Pang(2004)的方法,在情感分类前进行主观性检测,将其命名为“主观 MR”。
以下是不同模型和先验情感知识的实验结果:
| 先验情感 | OR(%) | UR(%) | ARO(%) | JST(%) |
| — | — | — | — | — |
| MPQA | 69.8 | 71.0 | 71.5 | 70.4 |
| 过滤后的 MPQA | 81.5 | 82.3 | 83.5 | 82.8 |
| 过滤后的 MPQA(主观 MR) | 84.8 | 85.
超级会员免费看
订阅专栏 解锁全文
8

被折叠的 条评论
为什么被折叠?



