PyTorch学习笔记(14)池化 线性 激活函数

本文详细介绍了PyTorch中的池化操作,包括nn.MaxPool2d和nn.AvgPool2d,讨论了线性层nn.Linear,并探讨了多种激活函数如Sigmoid、tanh、ReLU及其变种LeakyReLU、PReLU和RReLU的特性和应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

池化、线性、激活函数

池化层 Pooling Layer

池化运算:对信号进行“收集”并“总结”,类似水池收集水资源,因而得名池化层
“收集”:多变少
“总结”:选取最大值或平均值

nn.MaxPool2d

功能 对二维信号(图像)进行最大值池化
主要参数
kernel_size 池化核尺寸
stride 步长
padding 填充个数
dilation 池化核间隔大小
ceil_mode 尺寸向上取整
return_indices 记录池化像素索引 最大值像素所在位置

线性层 Linear Layer

激活函数层 Activation Layer

nn.AvgPool2d

对二维信号(图像)进行平均值池化
主要参数
kernel_size 池化核尺寸
stride 步长
padding 填充个数
dilation 池化核间隔大小
ceil_mode 尺寸向上取整
count_include_pad 填充值用于计算
divisor_override 除法因子

nn.MaxUnpool2d

功能 对二维信号(图像)进行最大值池化上采样
kernel_size 池化核尺寸
stride 步长
padding 填充个数



# -*- coding: utf-8 -*-

import os
import torch
import torch.nn as nn
from PIL import Image
from torchvision import transforms
from matplotlib import pyplot as plt
from tools.common_tools import transform_invert, set_seed

set_seed(3)  # 设置随机种子

# ================================= load img ==================================
path_img = os.path.join(os.path.dirname(os.path.abspath(__file__)), "lena.png")
img = Image.open(path_img).convert('RGB')  # 0~255

# convert to tensor
img_transform = transforms.Compose([transforms.ToTensor()])
img_tensor = img_transform(img)
img_tensor.unsqueeze_(dim=0)    # C*H*W to B*C*H*W

# ================================= create convolution layer ==========================&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值