开放信息提取系统Graphene的性能评估与分析
1. 引言
在自然语言处理领域,开放信息提取(Open IE)是一个重要的研究方向,旨在从文本中自动提取关系和实体信息。本文围绕一种名为 Graphene 的开放信息提取参考实现展开,通过在多个基准测试上的评估,全面分析其性能,并与其他主流的开放信息提取系统进行对比。
2. 评估基准与方法
为了全面评估 Graphene 的性能,研究团队选择了三个近期提出的开放信息提取基准:OIE2016、CaRB 和 WiRe57。每个基准都配备了评估框架,能够基于精确率(Precision)和召回率(Recall)对各个开放信息提取系统进行比较。
2.1 OIE2016 基准测试
在 OIE2016 基准测试中,Graphene 展现出了出色的性能。其平均精确率达到 78.5%,能够以 63.8% 的高召回率提取高度准确的关系元组。以下是各系统在 OIE2016 基准上的精确率、召回率、F1 值和 AUC 得分对比:
| 系统 | 精确率 | 召回率 | F1 值 | AUC |
| — | — | — | — | — |
| ReVerb | 0.836 | 0.446 | 0.582 | 0.296 |
| Ollie | 0.660 | 0.541 | 0.595 | 0.357 |
| ClausIE | 0.430 | 0.684 | 0.528 | 0.294 |
| Stanford Open IE | 0.140 | 0.375 | 0.204 | 0.203 |
| PropS | 0.556 | 0.521
超级会员免费看
订阅专栏 解锁全文
36

被折叠的 条评论
为什么被折叠?



