字符级RNN模型姓氏对应国家分类 1 序言 1 数据来源与加载 1.1 数据来源 1.2 数据加载 2 数据预处理 2.1 单个字符数据处理标准 2.2 单词的张量构造 3 模型创建 4 模型训练 5 模型检验 6 模型预测 7 模型部署 1 序言 本文的任务主要来源于PyTorch的官方教程,即给定各国人名的数据集,你需要训练出一个RNN,它能够根据输入的人名来判断这个人来自哪个国家(分类任务)。 文中主要参考: Iareges博主:使用RNN搭建字符级语言模型 官网示例: NLP FROM SCRATCH: CLASSIFYING NAMES WITH A CHARACTER-LEVEL RNN 本文重点在于全过程的梳理,具体包含了数据加载、数据预处理、模型创建、模型训练、模型评估、模型预测与模型部署 1 数据来源与加载 1.1 数据来源 官网提供的数据,打开上方的官网示例的链接中,在Preparing the Data下的Note中,如下 如果无法打开链接,可以直接下载已经处理完善后的数据: