情感分析与引用分类的创新方法
1. 情感分析新方法
在情感分析领域,为提升性能,提出了生成情感嵌入语义空间(SESS)的方法。与面向语义的词嵌入相比,SESS 能捕捉更多情感信息。在基准数据集上的实验表明,该方法在情感分析任务中的表现优于使用 Word2Vec 的方法。这一结果进一步证明了合适的词向量预训练是神经网络中的重要因素。
同时,对知网词典中具有两种情感极性的词的数量进行了描述,这显示了现有情感词典存在的歧义性。以下是知网情感词的统计情况:
| 类型 | 数量 |
| — | — |
| 知网单字正词(1PW) | 2468 |
| 知网单字正词在正数据中(1PWinPD) | 965 |
| 知网单字负词在正数据中(1NWinPD) | 710 |
| 知网单字负词(1NW) | 2899 |
| 知网单字负词在负数据中(1NWinND) | 902 |
| 知网单字正词在负数据中(1PWinND) | 828 |
2. 引用分类的背景与挑战
近年来,全球科学出版物通过引用相互关联,数量不断增加。为分析这些海量信息,引入了引用分类,以识别作者引用早期作品的观点和目的。现有方法利用机器学习技术,在识别引用的情感和目的方面取得了有前景的结果。然而,大多数先前的方法孤立地处理引用情感和目的分类,且面临训练数据有限和特征工程过程耗时的问题。
引用分类主要包括两个任务:
- 引用情感分类(CSC):检测引用的情感,分为积极、消极或中性。
- 引用目的分类(CPC):详细分析引用先前作品的目的/功能。
不同研究提出的引用