自动对话系统评估与未知词检测研究
全自动合作说服对话系统评估
在评估全自动合作说服对话系统时,我们先关注了自然语言理解(NLU)模块的准确性。NLU 模块的准确性结果如图 1 所示:
从图中可以看到,不同的 NLU 特征集对应的准确性有所不同。同时,还给出了混淆矩阵,如下表所示:
| 分类为/真实标签 | Other | Commissive | PropQ | Directive | Answer | Inform | SetQ | Question |
|---|---|---|---|---|---|---|---|---|
| Other | 43 | 0 | 0 | 0 | 0 | 3 | 0 | 0 |
| Commissive | 6 | 31 | 2 | 4 | 0 | 20 | 0 |
超级会员免费看
订阅专栏 解锁全文
1097

被折叠的 条评论
为什么被折叠?



