问答系统中的总结逻辑形式技术剖析
1. 问答领域的结论与现状
在需要简洁且权威答案的领域,应依靠成熟的基于推理的可控问答(Q/A)技术。对于客户关系管理(CRM)中的客户而言,他们需要高精度、即时且准确的答案来获得令人信服的推荐或快速解决问题。若在CRM环境中采用低于机器阅读理解(MRC)设定的问答标准,会降低客户对公司及时提供所需信息和解决问题能力的信心。
1.1 深度学习与“聪明汉斯”现象
在端到端的问答学习过程中,很难确定系统是否学习到了语义上的关键特征,而不是恰好与正确类别相关的句法线索。大多数深度学习研究只要评估显示性能良好,就不太关注决策所使用的特征。这使得模型与训练数据集紧密相连,难以判断其是否学习到可用于其他领域和数据集的重要语义特征。
这里有一个与深度学习方法类似的例子,即“聪明汉斯”马。这匹马经过训练,能用蹄子敲击黑板上的数字来解决数学问题,它的能力曾让公众惊叹。但后来发现,每次马蹄敲击时,提问者的呼吸、姿势和面部表情会不自觉地发生变化,表现出轻微的紧张。当敲击到“正确”数字时,这种紧张感会突然消失,汉斯似乎将此作为停止敲击的信号。当提问者不知道正确答案时,汉斯就无法获得必要的反馈。同样,深度学习可能会利用人类标注者提供的与目标现象弱相关的特征。
许多用于问答的神经模型被提出,如针对SQuAD、NewsQA、TriviaQA和SQuAD - Open等数据集的模型。高性能模型采用了共注意力或双向注意力机制来构建文档和问题的相互依赖表示。然而,学习文档的完整上下文既具有挑战性又效率低下。特别是当模型处理长文档或多个文档时,学习完整上下文的速度极其缓慢,难以扩展到大型语料库。此外,一些研究表明,在面对对抗性输入时,这些模
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



