自然语言处理在软件测试与敏捷开发中的应用
1. 生物医学自然语言处理系统性能评估
在生物医学自然语言处理领域,系统性能评估至关重要。对于BioCreative I语料库,系统的精确率为0.65,召回率为0.68;而对于PMC语料库,精确率为0.71,召回率为0.62。不同等价类的系统性能如下表所示:
| Prediction | BioCreative(TP FP FN P R) | PubMed Central(TP FP FN P R) |
|---|---|---|
| 1 | 12 57 17 0.17 0.41 | 8 10 0 0.44 1.0 |
| 2 | 0 1 38 0.0 0.0 | 1 0 2 1.0 0.33 |
| 4 | 556 278 512 0.67 0.52 | 163 64 188 0.72 0.46 |
| 5 | 284 251 72 0.53 0.80 | 108 54 46 0.67 0.70 |
基于测试套件的预测大多得到了支持,唯一的异常是在PMC语料库上预测1出现了高召回率,而原本预测
超级会员免费看
订阅专栏 解锁全文
1143

被折叠的 条评论
为什么被折叠?



