《A Multi-task Approach for Named Entity Recognition in Social Media Data》
论文来源:ACL
论文时间:2017年9月
论文方向: 多任务学习,命名实体识别
论文链接:https://www.aclweb.org/anthology/papers/W/W17/W17-4419/
1. 摘要:
社交信息的缺点:固有的噪声信息;不当的语法结构;拼写不连续以及大量的缩写词
多任务框架: 使用命名实体分割的辅助任务和细粒度的命名实体分类的主要任务进行联合训练
优点:多任务学习能够从字词序列、语法信息和地名词典信息中学习到更高阶的特征。
神经网络在此作为一个特征 提取器,将提取到的特征传到CRF分类器中。
2. 引言:
联合训练多任务学习神经网络模型
CNN提取字粒度的信息: :提取字的形态信息和其他正交特征
BILSTM提取词粒度的信息: 上下文信息以及句法特征
地名词典应用:捕捉到比较常见的实体采用地名表的表示。
CRF: 神经网络提取的特征输入CRF进行分类。
CNN个LSTM是并行的,而不是将CNN的输出作为LSTM的输入
主要贡献: 使用多任务学习,并且结合了POS(句法分析)和地名词典表示满足网络的需求。

这篇论文提出了一种多任务学习方法,结合CNN和BILSTM,利用字符、词和词典信息,对社交媒体数据进行命名实体识别(NER)。通过联合训练NER分割和分类任务,以及使用CRF考虑序列信息,提高了识别效果。实验表明,这种方法能有效应对社交数据的噪声和特殊性。
最低0.47元/天 解锁文章
2040

被折叠的 条评论
为什么被折叠?



