从零开始造一个“智障”聊天机器人

最新推荐文章于 2024-04-22 02:53:46 发布

原创

最新推荐文章于 2024-04-22 02:53:46 发布 · 1.3k 阅读

9 ·

CC 4.0 BY-SA版权

本文介绍了如何从零开始构建一个简单的聊天机器人。首先讲解了自然语言处理（NLP）和神经网络的基础知识，接着介绍了使用Tensorflow实现的seq2seq模型。语料准备包括从Github下载的对话数据，通过代码进行整理。训练过程中，使用Perplexity作为评估指标，并展示了初步的对话效果。虽然机器人还存在不足，但整个流程已能展现基本的问答功能。

要造一个聊天机器人，首先你需要了解一些相关概念——自然语言处理（NLP），它是一门融语言学、计算机科学、数学于一体的科学，研究让电脑“懂”人类语言的方法。当然，它也包含很多分支：文本朗读、语音识别、句法分析、自然语言生成、人机对话、信息检索、信息抽取、文字校对、文本分类、自动文摘、机器翻译、文字蕴含等等等。

看到这里的朋友，千万别被这些吓跑。既然本文叫《从零开始造一个“智障”聊天机器人》那么各位看官老爷不懂这些也没有关系！跟着我的脚步一步一步做吧。

0x1 基本概念

这里涉及到的原理基础，没兴趣的看官老爷略过即可，不影响后续代码实现。

01｜神经网络

人工智能的底层是”神经网络“，许多复杂的应用（比如模式识别、自动控制）和高级模型（比如深度学习）都基于它。学习人工智能，一定是从它开始。

那么问题来了，什么是神经网络呢？简单来说，神经网络就是模拟人脑神经元网络，从而让计算机懂得”思考“。具体概念在这里不再赘述，网络上有很多简单易懂的解释。

本文使用的的是循环神经网络(RNN)，我们来看一个最简单的基本循环神经网络：

从零开始造一个“智障”聊天机器人

虽然图像看起来很抽象，但是实际很好理解。x、o、s是一个向量，x代表输入层的值，o代表输出层的值，s是隐藏层的值(这里其实有很多节点);U、V是权重矩阵，U代表输入层到隐藏层的权重矩阵，而V则代表隐藏层到输出层的权重矩阵。那么W是什么呢？其实循环神经网络的隐藏层的值s不仅仅由x、U决定，还会由上一次隐藏层的值s，而W就是上一次到隐藏层到这一次的权重矩阵，将其展开就是这样：

从零开始造一个“智障”聊天机器人

这样逻辑就清晰很多了，这便是一个简单的循环神经网络。而我们的智障，不对是“智能聊天机器人”便是使用循环神经网络，基于自然语言的词法分析、句法分析不断的训练语料，并把语义分析都融入进来做的补充和改进。

02｜深度学习框架

适合RNN的深度学习框架有很多，本文的聊天机器人基于Google开源的Tensorflow，从GayhubGithub的starts数便可以看出，Tensorflow是一个极其火爆的深度学习框架，并且可以轻松地在cpu / gpu 上进行分布式计算，下面罗列了一些目前主流深度学习框架的特性，大家可以凭兴趣选择框架进行研究：

从零开始造一个“智障”聊天机器人