基于模糊语义处理的西班牙语情感识别混合方法
1. 引言
情感是人类的基本特征,影响着我们的行为、思想和交流方式。尽管情感并非严格的语言实体,但它们通过语言得以表达,因此多年来受到心理学、社会学、医学和计算机科学等不同学科研究人员的关注。近年来,自然语言处理领域对文本对话中情感的自动识别表现出特别的兴趣,因为其研究在客户服务等领域有诸多应用,例如在社交媒体如 Twitter 上,客户期望能得到快速响应。
然而,文本中的自动情感检测任务面临着重大挑战。与视觉交流不同,文本缺乏面部表情和语音语调的辅助,而且理解文本中的情感还需克服上下文、讽刺、自然语言的歧义以及即时通讯应用中日益增长的行话等难题。
目前,解决这一任务的方法主要有基于规则和基于机器学习算法两类。基于规则的方法利用关键词及其与具有情感或情感价值的其他词的共现,常使用如 WordNet - Affect 或 SentiWordNet 等词汇资源,也被称为基于关键词或基于词典的方法。基于机器学习的方法则依赖特征提取,如频繁 n - 元组、否定、标点、表情符号、主题标签等,形成文本的特征表示,再由分类器进行预测。
但这些方法都存在一定局限性。基于规则的方法在文本内容覆盖方面存在不足,而基于机器学习的方法通常需要繁琐的特征选择过程,且由于情感表达的多样性,难以实现高覆盖率。深度学习方法虽然在一些任务中取得了成功,但也存在需要大量标注数据、计算能力要求高以及操作过程难以理解等缺点。
因此,本文提出了一种新的文本情感检测方法,将面向情感、借助词典的语义特征选择过程与监督学习算法相结合,旨在提高情感识别的效果。
超级会员免费看
订阅专栏 解锁全文
30

被折叠的 条评论
为什么被折叠?



