像莎士比亚一样写作的神经网络及深度学习框架入门
训练神经网络
在开始训练神经网络之前,我们先使用一个名为 Babi 的数据集进行练习,这个数据集是一个合成的问答语料库,用于教会机器回答关于环境的简单问题。虽然我们目前不将其用于问答任务,但该任务的简单性有助于我们更好地理解学习单位矩阵的影响。
操作步骤如下 :
1. 下载 Babi 数据集 :使用以下 bash 命令进行下载和解压。
wget http://www.thespermwhale.com/jaseweston/babi/tasks_1-20_v1-1.tar.gz
tar -xvf tasks_1-20_v1-1.tar.gz
- 打开并清理小数据集 :使用 Python 代码打开并清理数据集,用于训练网络。
import sys,random,math
from collections import Counter
import numpy as np
f = open('tasksv11/en/qa1_single-supporting-fact_train.txt','r')
raw = f.readlines()
f.close()
tokens = list()
for line in raw[0:1000]:
tokens.append(line.lower(
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



