情感极性分类中的因式语义序列核与代码切换态度依赖语言建模
情感极性分类相关研究
在情感极性分类领域,为了提高句子或文档极性分类的准确性,研究人员采取了一系列措施。
数据预处理
在进行词义消歧(WSD)时,考虑窗口大小为 15 个单词。为了增强语料库中句子与 WordNet::SenseRelate::AllWords 的兼容性,会将缩写表达式替换为完整形式,例如将 “won’t” 替换为 “will not”。
情感词典
多数工作仍利用单词的先验极性进行分类,但往往忽略了单词极性依赖于其表达语境这一事实。为解决此问题,研究使用了几个基于 WordNet 的极性词典,包括 SentiWordNet、Q - WordNet 和 Micro - WNOp。
根据聚合得分(A - score = P - score – N - score)为每个 WordNet 词义分配极性值:
- 正词义(A - score > 0)赋值为 “P”,如 “true#a#2”,P - score 为 1,N - score 为 0。
- 负词义(A - score < 0)赋值为 “N”,如 “cynical#a#1”,P - score 为 0,N - score 为 1。
- 客观和中性词义(A - score = 0)赋值为 “O”,如 “real#a#7”,P - score 和 N - score 均为 0。
还考虑了一种替代表示,为可具有两种极性的词义(A - score = 0,P - score ≠ 0,N - score ≠ 0,且 P - score = N - score)
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



