1. 准备对话数据
2. 搭建seq2seq模型
3. 训练模型,并预测聊天效果
通过使用“字典”和“语料”,已经完成了第一步的工作。
本文采用seq2seq模型来进行解决
主要为:输入问句-编码-解码-输出答句

此处,“输入问题 – 编码 – 解码 – 输出答句”就构成了一套完整的seq2seq模型。

第一个环节-输入问句

第二个环节-编码
编码过程,实际上就是算法探求问句含义的过程:


return_sequences 表示“输出的结果是否为序列”,

如果为true,那么,模型的形态是这样的:

如果为false,那么,模型的形态则为:

图中:绿色圆圈代表输入的汉字, 橘色圆圈代表输出的问句的含义。灰色方块代表一套RNN或LSTM算法。
第三个环节-解码
组织语言进行输出


整个流程

标准的seq2seq模型,形态如下:

本文介绍如何使用Seq2Seq模型构建聊天机器人,详细解释了从准备对话数据到搭建模型,再到训练并预测聊天效果的全过程。通过“输入问句-编码-解码-输出答句”的流程,实现对问句含义的探求和答句的生成。
2万+

被折叠的 条评论
为什么被折叠?



