论文题目:Hybrid code networks: practical and efficient end-to-end dialog control with supervised and reinforcement learning
作者:来自Microsoft Research的J. D. Williams
时间:2017
来源:ACL第55届年度会议
本文提出对话系统中的end-to-end训练可以借助少量但有效的数据来提高实用性和训练效率。文中介绍了Hybrid Code Networks(HCNs),是一种RNN的变形和优化,结合了含有特定领域知识的动作模版和软件。文中同时探索了HCN本身通过可以监督学习和增强学习达到的优化。