核心知识点:
- NLP 基础知识:标记化、词干提取、词袋
- 如何预处理数据并将
nltk
其输入到神经网络 - 如何在 Pytorch 中实现前馈神经网络并进行训练
- 该实现应该对初学者来说很容易理解,并提供对聊天机器人的基本理解。
- 使用具有 2 个隐藏层的前馈神经网络可以很简单地实现。
- 自定义您自己的数据集非常简单。只需修改
intents.json
可能的模式和响应并重新运行训练即可
1)设置你的环境
让我们首先设置虚拟环境并安装PyTorch
和nltk
。
创建环境
随你喜欢(例如conda
或venv
)
mkdir myproject
$ cd myproject
$ python3 -m venv venv
激活它
Mac / Linux:
. venv/bin/activate
视窗:
venv\Scripts\activate
安装 PyTorch 和依赖项
有关 PyTorch 的安装请参阅官方网站。
您还需要nltk
:
pip install nltk
如果在第一次运行期间出现错误,您还需要安装nltk.tokenize.punkt
:在终端中运行一次:
$ python
>>> import nltk
>>> nltk.download('punkt')