Generative-Based:IT语料库加电影对白语料库,通过简单的案例,把IT所有知识,强AI形式,目前还没有被攻克,不错的paper:ACL会议,主题是使用了一堆词条,假设可以涵盖了社会的方方面面的知识,维基百科,词条的形式进行分析,你问题都以维基百科的知识回答;
Retrieval-Based:闭合的场景,所有的问题基本都能想得到,Rules-Based,工业界很感兴趣,加入知识图谱中的动作,机制还是Rules-Based.
二、机器人永远回答是或否
short-yes or no
long-回溯到很久前聊到的话题;能否阐述足够长的回复解决问题。
两个机器人本来是想互相学习:通过强化学习,互相对话,互相学习,结果两个机器人之间是问题都是封闭的。
不管是端对端,ML会倾向学习正确率较高,错误率较低的点回复。the在文章中出现的概率较高,这样出错的概率较小;
三、
1、语境问题的处理:
语言语境:这句话在说什么内容?(涉及到对语言的embed,比如word vector)
物理语境:这句话在哪里说的?(涉及到物理环境,比如在哪里,现在几点)
推荐paper:
Building End-To-End Dialogue SystemsUsing Generative Hierarchical Neural