- 我们可以使用PyTorch的高级API更简洁地实现模型。
- 在PyTorch中,data模块提供了数据处理工具,nn模块定义了大量的神经网络层和常见损失函数。
生成数据
生成数据和之前一样
def create_data(w,b,num_examples):
"""生成y=Xw+b+噪声"""
X = torch.normal(0, 1, (num_examples, len(w)))
y = torch.matmul(X,w) + b
y += torch.normal(0,0.01,y.shape)
return X, y.reshape(-1,1)
读取数据
使用torch.utils 的 data模块处理数据。创建一个数据迭代器,用于小批量数据的迭代。
def read_data(data_arrays, batch_size, is_train=True):
"""构造一个 PyTorch 数据迭代器"""
dataset = data.TensorDataset(*data_arrays)
return data.DataLoader(dataset, batch_size, shuffle=is_train)
data.TensorDataset(*data_arrays)
创建一个包含特征和标签的数据集。其中*是元组解包的意思, data_arrays是一个(features, labels) 的元组。
data.DataLoader
构建数据加载器,指定批量大小 batch_size 和是否打乱数据 shuffle=is_train
。
定义模型、初始化模型参数
# 定义线性回归模型
net = nn.Sequential(nn.Linear(2, 1))
# 初始化模型参数
net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)
使用 nn.Sequential
定义线性回归模型。。第一个指定输入特征形状,即2,第二个指定输出特征形状,输出特征形状为单个标量,因此为1。
初始化权重w
为均值 0、标准差 0.01 的正态分布。初始化偏置b
为 0。
定义损失函数、优化算法
# 定义损失函数
loss = nn.MSELoss()
# 定义优化算法
trainer = torch.optim.SGD(net.parameters(), lr=0.03)
使用均方误差损失函数 nn.MSELoss()
。
使用随机梯度下降优化算法 torch.optim.SGD
,学习率为 0.03。
训练
# 训练周期为10
num_epochs = 10
for epoch in range(num_epochs):
for X, y in data_iter:
l = loss(net(X), y)
trainer.zero_grad()
l.backward()
trainer.step()
l = loss(net(features), labels)
print(f'epoch {epoch + 1}, loss {l:f}')
训练 10 个周期(epochs)。
在每个周期中,遍历数据迭代器,计算损失 l = loss(net(X), y)
。
清零梯度 trainer.zero_grad()
。
反向传播 l.backward()
。
更新模型参数 trainer.step()
。
在每个周期结束时,计算整个数据集上的损失并打印。