多层感知机实现

部署运行你感兴趣的模型镜像

前面利用了softmax来对图像进行分类,也可以使用多层感知机的方法对图像进行分类。

多层感知机从零开始实现方法

多层感知机(multilayer perceptronMLP),在单层神经网络的基础上引入了一到多个隐藏层(hidden layer)。
 
 
对于图中的感知机来说,它含有一个隐藏层,该层中有5个隐藏单元。输入和输出个数分别为43,中间的隐藏层中包含了5个隐藏单元。由于输入层不涉及计算,图中的多层感知机的层数为2
隐藏层位于输入层和输出层之间。隐藏层中的神经元和输入层中各个输入完全连接,输出层中的神经元和隐藏层中的各个神经元也完全连接。因此,多层感知机中的隐藏层和输出层都是全连接层。
 

1.导入包

import torch
import numpy as np
import sys
sys.path.append("..") # 为了导入上层目录的d2lzh_pytorch
import d2lzh_pytorch as d2l

print(torch.__version__)

2.获取和读取数据

使用Fashion-MNIST数据集。我们将使用多层感知机对图像进行分类。
batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

3.定义模型参数

Fashion-MNIST数据集中图像形状为 28x28,类别数为10。本节中我们依然使用长度为 28x28=784的向量表示每一张图像。因此,输入个数为784,输出个数为10。实验中,我们设超参数隐藏单元个数为256
num_inputs, num_outputs, num_hiddens = 784, 10, 256

W1 = torch.tensor(np.random.normal(0, 0.01, (num_inputs, num_hiddens)), dtype=torch.float)
b1 = torch.zeros(num_hiddens, dtype=torch.float)
W2 = torch.tensor(np.random.normal(0, 0.01, (num_hiddens, num_outputs)), dtype=torch.float)
b2 = torch.zeros(num_outputs, dtype=torch.float)

params = [W1, b1, W2, b2]
for param in params:
    param.requires_grad_(requires_grad=True)

4.定义激活函数

使用基础的 max 函数来实现ReLU,而非直接调用 relu 函数。
def relu(X):
    return torch.max(input=X, other=torch.tensor(0.0))

5.定义模型

通过 view 函数将每张原始图像改成长度为 num_inputs 的向量。然后我们实现上一节中多层感知机的计算表达式。
def net(X):
    X = X.view((-1, num_inputs))
    H = relu(torch.matmul(X, W1) + b1)
    return torch.matmul(H, W2) + b2

6.定义损失函数

直接使用PyTorch提供的包括softmax运算和交叉熵损失计算的函数。
loss = torch.nn.CrossEntropyLoss()

7.训练模型

num_epochs, lr = 5, 100.0
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, params, lr)

简洁实现的方法:

1.定义模型

num_inputs, num_outputs, num_hiddens = 784, 10, 256
    
net = nn.Sequential(
        d2l.FlattenLayer(),
        nn.Linear(num_inputs, num_hiddens),
        nn.ReLU(),
        nn.Linear(num_hiddens, num_outputs), 
        )
    
for params in net.parameters():
    init.normal_(params, mean=0, std=0.01)

2.读取数据并训练模型

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
loss = torch.nn.CrossEntropyLoss()

optimizer = torch.optim.SGD(net.parameters(), lr=0.5)

num_epochs = 5
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, None, None, optimizer)

 

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.9

TensorFlow-v2.9

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

### 使用多层感知机(MLP)实现二分类任务 #### 数据准备 为了完成二分类任务,通常需要先对数据集进行预处理。这包括但不限于缺失值填充、特征缩放以及目标变量的转换。例如,在某些情况下,可以通过计算某一列的均值作为阈值,将连续型的目标变量转化为离散型的类别标签[^4]。 ```python import pandas as pd # 假设我们有一个DataFrame名为df_linear_interpolation threshold = df_linear_interpolation['CO(GT)'].mean() df_linear_interpolation['CO_Target'] = (df_linear_interpolation['CO(GT)'] > threshold).astype(int) ``` 上述代码片段展示了如何通过设定阈值将连续型变量`CO(GT)`划分为两类:高于均值和低于等于均值。 --- #### 特征工程与数据分割 在构建模型之前,还需要对数据进行标准化或归一化操作,因为多层感知机对于输入数据的尺度较为敏感[^1]。此外,应将数据集拆分为训练集和测试集以便评估模型性能。 ```python from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler X = df_linear_interpolation.drop(columns=['CO_Target']) y = df_linear_interpolation['CO_Target'] scaler = StandardScaler() X_scaled = scaler.fit_transform(X) X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42) ``` 此处使用了`StandardScaler`来进行标准差归一化,并利用`train_test_split`方法划分训练集与测试集。 --- #### 构建并训练多层感知机模型 借助于Scikit-Learn库中的`MLPClassifier`模块,可以快速搭建一个多层感知机用于解决二分类问题。下面是一个简单的配置实例: ```python from sklearn.neural_network import MLPClassifier mlp_model = MLPClassifier(hidden_layer_sizes=(10,), activation='relu', solver='adam', max_iter=500, random_state=42) mlp_model.fit(X_train, y_train) ``` 在此段代码中,设置了单个隐藏层且其包含10个神经元;激活函数选择了ReLU;优化器采用Adam算法;最大迭代次数被限定为500次以避免长时间运行[^3]。 --- #### 模型评估 最后一步是对已训练好的模型进行验证,查看它在未见过的数据上的表现情况。 ```python from sklearn.metrics import classification_report, confusion_matrix predictions = mlp_model.predict(X_test) print(confusion_matrix(y_test, predictions)) print(classification_report(y_test, predictions)) ``` 这段脚本会打印混淆矩阵以及详细的分类报告,帮助分析模型的各项指标如精确率、召回率等。 --- ### 总结 综上所述,使用多层感知机执行二分类任务涉及几个关键环节——从原始数据清洗到最终的结果评价。每一步都至关重要,直接影响到最后所得结论的有效性和可靠性。 相关问题
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值