Pytorch中哪些操作是不可微的，构建前向计算图时需要特加注意

原创

于 2024-10-15 09:05:02 发布 · 1k 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #人工智能 #python

PyTorch中那些神秘的“黑洞”——不可微操作与构建前向计算图的那些事儿

在深度学习领域，PyTorch凭借其动态图计算机制、简洁直观的API设计以及强大的社区支持，迅速成为研究者和开发者们手中的利器。但即便是这样一款强大而灵活的工具，依然存在一些操作上的“禁区”，即所谓的“不可微”操作。这些操作在构建神经网络模型时，尤其是涉及到自动梯度计算的反向传播过程时，可能给我们的训练流程带来不小的麻烦。今天，就让我们一起揭开这些神秘“黑洞”的面纱，探索它们的成因，并且看看在构建前向计算图时应如何规避潜在的风险。

一、不可微操作概述

所谓“不可微”操作，在数学上通常指的是函数在某一点或者某一区间内不存在导数的情形。在神经网络中，“不可微”则意味着该操作无法被自动求导机制正确处理，这直接影响到模型的学习能力。对于使用PyTorch进行开发的人来说，理解哪些常见的操作会导致“不可微”是非常重要的，因为这关系到模型能否顺利地通过反向传播来进行参数更新。

1. 阶跃函数（Step Function）

最典型的例子就是阶跃函数。阶跃函数是一个不连续的函数，它在特定值处突然从一个常数值跳变到另一个常数值。这种突变使得函数在跳变点上没有定义良好的导数，因此无法用于训练需要连续可微性的模型。

import torch
x = torch.tensor([[-1, 0], [1, 2

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xiamu_CDA

关注关注

9
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

PyTorch深度学习实战（3）——使用PyTorch构建神经网络

盼小辉丶的博客

06-13

8万+

PyTorch 是一个用于构建深度神经网络的库，具有灵活性和可扩展性，可以轻松自定义模型。在本节中，我们将使用 PyTorch 库构建神经网络，利用张量对象操作和梯度值计算更新网络权重，并利用 Sequential 类简化网络构建过程，最后还介绍了如何使用 save、load 方法保存和加载模型，以节省模型训练时间。

图神经网络实战（6）——使用PyTorch构建图神经网络

最新发布

盼小辉丶的博客

03-28

1万+

图数据集通常比简单的连接集合更加丰富，因为节点和边可以具有表示分数、颜色、单词等特征。包含这些额外信息在输入数据中对于生成最佳嵌入至关重要。在本节中，我们将使用 Cora 和 Facebook Page-Page 数据集，首先将它们视为表格数据集，观察香草神经网络在节点特征上的表现如何。然后，尝试在神经网络中加入拓扑信息，实现图神经网络 (Graph Neural Networks, GNN) 架构：一个同时考虑节点特征和边的简单模型。最后，我们将比较两种架构的性能。

参与评论您还未登录，请先登录后发表或查看评论

pytorch每日一学28(torch.heaviside())对输入中的每一个元素都进行单位阶跃函数处理并返回结果的tensor

Fluid_ray的博客

11-25

2998

第28个方法 torch.heaviside(input, values, * , out=None) → Tensor 此方法存在于pytorch1.7.0，1.7.0以下的pytorch中没有此方法。其功能为对输入中的每个元素计算Heaviside阶跃函数。 Heaviside阶跃函数（也就是单位阶跃函数）定义为：各个参数介绍： input：输入tensor。 values：输入为0时要使用的值（大小需要和input相等或者为1位） out：输出的tensor。使用方法如下： >&g

【Torch API】pytorch 中torch.heaviside()函数详解

devil_son1234的博客

04-21

678

torch.heaviside()

pytorch深度学习基础（一）——激活函数的介绍与对比

艾醒的博客

03-11

3412

Python深度学习基础：激活函数的介绍以及图像的对比展示

pytorch的求导计算以及处理不可微方法

qq_39861441的博客

08-23

2235

一.pytorch求导计算法就是普通的微分求导，详见https://zhuanlan.zhihu.com/p/51385110 二.pytorch处理不可微的方式没有被选择到的直接归零 import torch #x = torch.tensor([[1.,2.,3.],[4.,5.,6.]],requires_grad=True) x= torch.randn(2,3,requires_grad=True) y = torch.add(x,1) print(y) z = 2*torc.

Pytorch 阶跃函数，与门电路

qq_44625074的博客

02-02

1026

#阶跃函数，与门电路 import torch X = torch.tensor([[1,0,0],[1,1,0],[1,0,1,],[1,1,1]] ,dtype = torch.float32) andgate = torch.tensor([[0],[0],[0],[1]],dtype = torch.float32) w = torch.tensor([-0.2,0.15,0.15] ,dtype = torch.float32) # b,w1,w2 def LinearRwithsign(X,w

深度学习Pytorch中计算图的概念及理解

q774798577的博客

01-18

2379

深度学习pytorch框架计算图的概念理解

Pytorch学习（四）搭建简单的神经网络

Yannie's Blog

06-12

370

神经网络的基本概念神经网络是属于机器学习中的一种算法神将网络也是由多层的感知器（第二层神经元+构成它的第一层神经元这个组合叫一个感知器）构成的这样一种网络结构。多隐藏层的多层感知器 -> 深度学习 step function（阶跃函数）是激活函数（Relu sigmoid softmax）的一种。回归问题经常使用L1 L2 loss，分类问题经常食用softmax和交叉熵 dropout层就是：对我们某些连接的节点来进行抑制。所谓抑制就是将权值项置为0。这样这些节点就不起作用了。正

深度学习实践：python实现relu、sigmoid、阶跃函数

VIEO

03-09

8623

元学习论文总结||小样本学习论文总结 2017-2019年计算机视觉顶会文章收录 AAAI2017-2019 CVPR2017-2019 ECCV2018 ICCV2017-2019 ICLR2017-2019 NIPS2017-2019 python实现relu、sigmoid、阶跃函数 # coding:utf-8 import numpy as np import matplotli...

ML(1)-激活函数sigmoid、损失函数MSE、CrossEntropyLoss

sinat_40624829的博客

05-05

1万+

损失函数1.激活函数2.损失函数概述2.1均方误差损失函数2.2交叉熵损失函数2.3 NLLLoss()input is of size N x C = 3 x 5each element in target has to have 0 <= value < C 1.激活函数全连接网络又叫多层感知器，多层感知器的基本单元神经元是模仿人类神经元兴奋与抑制机制，对其输入进行加权求和，若超...

深度学习代码学习笔记(一)——阶跃函数与激活函数的python代码实现

weixin_45708475的博客

01-04

4825

深度学习代码学习笔记(一)——阶跃函数与激活函数的python代码实现今天正式开始学习深度学习，看的书是《深度学习入门——基于python的理论与实现》。感知机使用阶跃函数作为激活函数，而神经网络使用 sigmoid 函数作为激活函数。下面分别来用代码实现并绘制阶跃函数和激活函数的图形。一、阶跃函数 阶跃函数以阈值为界，一旦输入超过了阈值，就会切换输出。以下的阶跃函数step_func...

激活函数：阶跃函数、sigmoid函数、ReLU函数、softmax函数

热门推荐

God_68的博客

12-26

2万+

之前提到的激活函数是以阈值0（界限值）为界的，小于等于0，输出0，否则，输出1。类似于这样的切换输出函数被称之为“阶跃函数”。因此，可以说感知机的激活函数为阶跃函数。那么，如果感知机使用其他函数作为激活函数的话会怎么样呢？实际上，如果将激活函数从阶跃函数换成其他函数，就可以进入神经网络的世界了。 1、阶跃函数 下面我们就用图来表示上面定义的阶跃函数，为此需要使用 matplotlib 库。 ...

PyTorch实现Logistic regression

misite_J

04-10

2570

逻辑回归（Logistic regression）回归方法是对数值型连续随机变量进行预测和建模的监督学习算法。其特点是标注的数据集具有数值型的目标变量。回归的目的是预测数值型的目标值。逻辑回归对应线性回归，旨在解决分类问题，即将模型的输出转换为0/1值。逻辑回归直接对分类的可能性进行建模，无需事先假设数据的分布。最理想的转换函数是单位阶跃函数（也称Heaviside函数），但单位阶跃函数...

PyTorch常用激活函数

Steven的博客

05-27

1万+

两个或多个线性网络层叠加，并不能学习一个新的东西，简单的堆叠网络层，而不经过非线性激活函数激活，学到的仍然是线性关系。通过激活函数的加入可以学到非线性的关系，这对于特征提取具有更强的能力...

Continuous Output - The sigmoid function（sigmoid函数）

tfdev的博客

03-23

716

Given Summed Input: x = Instead of threshold, and fire/not fire,we could have continuous output y according to the sigmoid function: Note e and its properties. As x goes to

[Deep Learning]——梯度、激活函数及其梯度求导(PyTorch)

weixin_42067873的博客

09-18

1595

Clarification：导数：一个函数在x处的变化量，即：导数本身是一个标量，x向左或者向右的变化率。导数的方向可以任意指定偏微分：一个函数对其自变量变化率的描述，函数有多少个自变量就有多少偏微分梯度：把所有的偏微分当作向量来理解，梯度有方向和大小梯度的长度反映：函数的变化趋势，即当前点的增长速率梯度的方向：在当前点的增长方向一、How to search for minima? 1、Convex function 凸函数：在曲面.

单位阶跃函数（Heaviside/unit step function）—— 化简分段函数

weixin_30878501的博客

05-13

4980

注意，单位阶跃函数一种不连续函数。 1. 常见定义最经典的定义来自于 Ramp function（斜坡函数，max{x,0}）的微分形式； H(x)=ddxmax{x,0} 2. 化简分段函数如对于指数分布的概率密度函数： f(x;λ)={λe−λx0x≥0,x<0.⇒f(x;λ)=λe−λxH(x) 其中 H(0) 约定为...