【每周NLP论文推荐】生成式聊天机器人论文介绍

最新推荐文章于 2025-08-12 10:01:43 发布

原创最新推荐文章于 2025-08-12 10:01:43 发布 · 1.6k 阅读

9 ·

CC 4.0 BY-SA版权

本文回顾了生成式聊天机器人从早期开创性工作到引入Attention机制的研究历程，涵盖SMT、RNN、LSTM、HRED及Attention模型的关键进展。

欢迎来到《每周NLP论文推荐》。在这个专栏里，还是本着有三AI一贯的原则，专注于让大家能够系统性完成学习，所以我们推荐的文章也必定是同一主题的。

生成式聊天机器人是研究的热点，现在看来，通过端到端的方式，构建一个可靠又可控的聊天机器人还是没有太多方法。本篇我们来看看，聊天机器人的研究者们在这方面都做了哪些努力。

作者 | 小Dream哥

编辑 | 言有三

1 早期开创性的工作

这是第一篇将SMT引入聊天机器人中实现答案生成的论文，具有开创性的意义。

文章引用量：140+

推荐指数：✦✦✦✦✧

[1] Ritter A , Cherry C , Dolan W B . Data-Driven Response Generation in Social Media[C]// Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing, EMNLP 2011, 27-31 July 2011, John McIntyre Conference Centre, Edinburgh, UK, A meeting of SIGDAT, a Special Interest Group of the ACL. Association for Computational Linguistics, 2011.

2 RNN based

这是早期用RNN网络实现端到端的聊天机器人研究的一篇典型论文。

文章引用量：180+

推荐指数：✦✦✦✦✧

[2] Sordoni A , Galley M , Auli M , et al. A Neural Network Approach to Context-Sensitive Generation of Conversational Responses[J]. Transactions of the Royal Society of Tropical Medicine & Hygiene, 2015, 51(6):502-504.

3 LSTM based

随着NLP的发展，end-to-end的聊天机器人研究均开始引入LSTM作为特征抽取器，这是典型的一篇。

文章引用量：130+

推荐指数：✦✦✦✦✦

[3] Li J , Galley M , Brockett C , et al. A Diversity-Promoting Objective Function for Neural Conversation Models[J]. Computer Science, 2015.

4 HRED Model

LSTM能够提出长度约为500的句子的特征，但是机器人生成答案常常需要参考更长的对话历史和语境。因此，HRED模型得以引入。

文章引用量：58

推荐指数：✦✦✦✦✦

[4] Sordoni A , Bengio Y , Vahabi H , et al. A Hierarchical Recurrent Encoder-Decoder For Generative Context-Aware Query Suggestion[J]. Computer Science, 2015.

5 Attention Model

在是输入较长时以上的机制都比较无力，为了提升答案生成能力，Attention机制开始被引入。

文章引用量：较少

推荐指数：✦✦✦✦✦