pytorch-多层感知机MLP

我渊啊我渊啊

已于 2022-07-03 09:48:37 修改

阅读量522

点赞数 4

分类专栏： DeepLearning-pytorch 文章标签： pytorch 深度学习 python

于 2022-07-03 09:37:17 首次发布

本文链接：https://blog.youkuaiyun.com/qq_51333166/article/details/125581159

版权

DeepLearning-pytorch 专栏收录该内容

12 篇文章

订阅专栏

本文介绍了多层感知机的基本结构，包括输入层、隐藏层及输出层间的全连接特性，并探讨了激活函数如何帮助神经网络实现非线性映射。通过使用ReLU等常见激活函数，多层感知机能够解决复杂的学习任务。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、隐藏层

输入层和隐藏层是全连接
隐藏层和输出层是全连接
Alt

Alt

2、激活函数

激活函数（activation function）通过计算加权和并加上偏置来确定神经元是否应该被激活，它们将输入信号转换为输出的可微运算。

3、小结

多层感知机在输出层和输入层之间增加一个或多个全连接隐藏层，并通过激活函数转换隐藏层的输出。使得多层感知机可以进行非线性的拟合。
常用的激活函数包括ReLU函数、sigmoid函数和tanh函数。

import torch
from torch import nn
from d2l import torch as d2l

net = nn.Sequential(nn.Flatten(),
                    nn.Linear(784, 256),
                    nn.ReLU(),
                    nn.Linear(256, 10))

def init_weights(m):
    if type(m) == nn.Linear:
        nn.init.normal_(m.weight, std=0.01)

net.apply(init_weights);

batch_size, lr, num_epochs = 256, 0.1, 10
loss = nn.CrossEntropyLoss(reduction='none')
trainer = torch.optim.SGD(net.parameters(), lr=lr)

train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

Alt