基于字典的用户评论问题短语提取及阿拉伯命名实体关系发现
1. 基于字典的问题短语提取
在处理用户评论时,系统将子集(S2)划分为几乎相等的类别,但问题类稍大,这反映了系统在精度和召回率之间的权衡。通过比较子集 S3 和 S4 中的正标签以及子集 S0 和 S1 中的负标签(如表 4 所示),也能说明这一点,后一种情况系统表现更好。
有趣的是,测试集中超过一半的问题是通过少数(核心)问题指标发现的(如表 3 所示)。鉴于核心指标包含在自动构建的字典中,我们可以利用 Google Books NGram Viewer 数据集将基于字典的系统应用到其他领域。
错误分析显示,假阴性问题短语有两个额外来源:
- 句子可能不包含问题指标,但包含间接特征,如“sent it back”“to return the tablet”“contacted hp product support”等。
- 一些多词表达即使不包含问题指标也可能表示问题,例如“too small”“too many”“little low”。
问题提取可视为信息提取任务。性能指标比较证实了这一观点。F1 度量值(约 75%)低于命名实体识别的 F1 度量值(超过 90%),但略好于事件提取的最佳 F1 值(约 60%),因此问题提取处于中间位置。
为了提高性能,我们将开发额外的字典,以找到所有可能包含问题的句子(即使没有问题指标)。我们认为,使用字典和当前的轻量级方法将召回率提高到 85%以上会很困难。提取字典方法未发现的问题句子可能需要更深入的语义分析,如扩展词袋模型和使用高级机器学习。
超级会员免费看
订阅专栏 解锁全文
616

被折叠的 条评论
为什么被折叠?



