任务型人机对话系统旨在帮助用户完成特定领域中的特定任务,例如:餐馆预订、天气查询和航班预订等,具有很高的应用价值。然而,一些问题阻碍了任务型对话系统在实际应用中进行部署:
一方面,任务型对话数据的收集和标注费时费力,且不同领域之间难以迁移;另一方面,虽然开放域的无标注对话数据易于获取、数据量大,利用这些数据可以训练的基于 sequence-to-sequence 结构的端到端对话系统,但采用开放域数据训练的端到端对话系统没有任务相关的信息,容易产生不可靠和无意义的回复。
研究表明,在对话数据上微调后的 GPT 模型可以生成有意义的系统回复,提高对话系统的性能。因此,在对话领域开发大规模预训练生成模型是有实际意义的。本文旨在对基于 GPT-2 的端到端任务型对话系统相关工作进行梳理和总结。
参考资料:
GPT2中文闲聊对话系统代码讲解
基于GPT-2的端到端任务型对话系统简述
从近年顶会论文看基于GPT-2的端到端任务型对话系统
对话系统有哪些最新进展?这17篇EMNLP 2021论文给你答案