情感分析与不充分支持论证识别的深度学习方法
1. 加权交叉熵在情感分析中的应用
在情感分析中,加权交叉熵是一个重要的概念。它与默认交叉熵在处理不同分类情况时会产生不同的损失值。
1.1 加权交叉熵示例
- 示例 1 :若实际标签 (y) 为 ([0, 1, 0])(负向),预测值 (\hat{y}) 为 ([0.2, 0.3, 0.5])(中性),默认交叉熵的结果为 1.204,而加权交叉熵的结果为 2.408。
- 示例 2 :若实际标签 (y) 为 ([1, 0, 0])(正向),预测值 (\hat{y}) 为 ([0.2, 0.7, 0.1])(负向),默认交叉熵的结果为 1.609,加权交叉熵的结果为 6.436。
这两个示例表明,加权交叉熵函数针对不同的错误分类情况给出了不同的损失值。目前,惩罚矩阵是基于直观直觉开发的,但未来可以依据数据的分布来构建。
1.2 情感分析实验设置
为了验证相关方法在情感分析中的有效性,进行了一系列实验,以下是具体的实验设置:
1. 数据收集 :收集了包含 100 万条带有情感标签的社交网络讨论数据,该数据集由 YouNet Media 提供,同时该公司还提供了一个包含正向和负向词汇的初始情感词典,不过这些情感词汇的情感得分仅手动分配了 4 个值(1, 0.5, -0.5, -1)。
2. 数据预处理 :最初,数据以 65000 维的独热向量表示,经过词嵌入技术
超级会员免费看
订阅专栏 解锁全文
58

被折叠的 条评论
为什么被折叠?



