基于并行深度学习的流行文化文本和英语幽默文学中的讽刺检测
1. 引言
讽刺在任何语言中的运用都高度依赖于所讨论主题的语境。它可以面无表情、带着冷笑甚至笑着表达,而不显示出任何明显的迹象。提取讽刺语句的真正潜在含义,而非直接的情感极性,是一项挑战。
当有独立的讽刺文本语料库时,我们可以仅关注讽刺文本,而无需考虑整个环境和背景。目前,该领域的大多数研究是通过二分类任务和实证细节来检测文本或短语是否具有讽刺意味。神经网络在讽刺检测任务中的准确性依赖于覆盖整个讽刺语料库的上下文或句子级别的注意力。
深度学习网络通过输入神经元表示为加权向量的计算组合。训练可以提高它们随时间重现权重组合的能力,增强讽刺的整体可学习性和检测能力,但往往难以捕捉主观性。
在这项工作中,我们旨在准确识别口语对话转化为文本后的复杂讽刺。具体操作步骤如下:
1. 选取一个讽刺文本语料库进行阅读,并手动对文件进行分词,以对文件中的词汇出现情况进行索引。
2. 引导从数据集中获得的加权向量,并通过从标记索引中获取的向量为输入,将我们的长短期记忆网络(LSTM)进行组合。
3. 引入一组简单而强大的四个并行长短期记忆网络(pLSTM),每个网络都有密集的隐藏层,且每组使用不同的激活函数。
4. 针对一些精选的开源幽默和讽刺文本语料库对所提出的网络进行评估。
2. 近期研究工作
- 多任务学习检测 :一组研究人员将情感分类和讽刺检测视为共同语言挑战的相关部分。他们设计了多任务学习系统,结合门控网络、全连接层和softmax激活函数,利用情感转变来更好地检测讽刺。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



