CNN笔记（CS231N）——深度学习软件（Deep Learning Software）

最新推荐文章于 2025-03-25 19:08:02 发布

Veropatrinica

最新推荐文章于 2025-03-25 19:08:02 发布

阅读量1.5k

点赞数

分类专栏： CNN 文章标签：神经网络框架 TensorFlow PyTorch Caffe 静态图vs动态图

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/shanwenkang/article/details/86794927

版权

CNN 专栏收录该内容

14 篇文章

订阅专栏

本文对比分析了TensorFlow、PyTorch和Caffe等主流深度学习框架的特点与应用，包括它们的计算图概念、自动求导机制、模型训练流程及预训练模型的使用，旨在帮助读者理解各框架的优势及适用场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

深度学习框架

我们在使用CNN的时候往往会采用深度学习框架来减小我们的工作量，以下是现在常用的一些深度学习框架

深度学习框架有以下意义

下面让我们来看看如果我们用numpy从头构建一个计算图是怎么样的，我们可以看出它有以下两个问题：不能在GPU上运行以及梯度需要我们手动计算

我们采用深度学习的框架可以很好的解决以上问题：让程序在GPU上运行仅仅需要一行代码，以及程序可以自动为我们计算梯度

TensorFlow

下面让我们来看一下tf的具体细节。我们看下图的程序，在tf.session()之前的代码是定义计算图，在这部分不进行任何的实际计算，在tf.session()之后的代码是给计算图赋予输入，让它运行起来并计算梯度。我们可以看出来在计算图的定义过程中首先为每个变量定义了一个placeholders，之后定义了计算图的结构以及代价函数。在计算的过程中，我们创建了很多numpy array来填充placeholders，之后运行计算图

为了更新权重，我们还需要增加几行代码。但是这种方法有个问题，就是计算图是在GPU上运行的，而我们的更新权重是在CPU上运行的，因此每次我们都需要将权重从CPU搬到GPU中，大大降低了程序运行的速度

为了解决这个问题我们可以将权重定义为variale来使得权重能够在计算图中保持一致。由于权重变为了存在于计算图中，因此我们每次我们需要把更新权重的代码放到前面的计算图定义中

但是我们如果采用如上代码会发现代价函数值在运行的时候完全没有降低，原因是我们虽然定义了更新权重的代码，但是在运行的时候完全没有运行它。解决方案就是我们加一行完全没作用的代码将更新权重的代码包含进来，然后在输出的时候输出这个值，这样在运行的时候我们就会运行权重更新的代码

另外在tf中我们有很多高阶API让我们无需手动实现loss、权重更新、卷积层定义以及初始化的过程，这种方法往往更简单，也拥有更好的效果。

另外我们还有Keras这种高阶封装器将以上过程封装起来进一步简化上述过程

除了Keras还有一些其他的封装器供我们使用

另外TensorFlow还有一些预训练模型、可视化工具供我们使用

PyTorch

除了TensorFlow，还有一种常用的框架是PyTorch。我们可以将PyTorch中一些常用概念与TF中的概念进行类比

PyTorch的Tensors与numpy array类似，以下是用Tensors构建的神经网络，我们可以看出来这种网络也是需要我们手动计算梯度

再往下引入计算图概念以后，我们将变量封装在Variable中，然后就可以用autograd来自动计算梯度了，Tensors 和Variables拥有相同的API。我们在声明Variable的时候就要说明是否需要计算它的梯度

另外我们还可以定义自己的autograd函数来计算梯度

与TF中高阶封装器类似，PyTorch中也有nn来简化我们的工作

4

除此以外PyTorch中也有optimizer来简化权重更新

除了使用自带的model，我们还可以自己定义model，我们在定义model的时候不需要定义backward，因为autograd可以自动处理求梯度的过程

PyTorch中dataloaders来供我们导入数据。我们从dataloaders中得到的数据是Tensors格式的，若要用到神经网络中我们应将其变为Variable

另外PyTorch中也提供预训练模型、可视化工具等

我们可以将TensorFlow和PyTorch进行如下对比

静态图vs动态图

TensorFlow和PyTorch的另外一个区别就是TensorFlow采用的是静态图而PyTorch采用的是动态图

静态图的好处是我们预先定义计算图以后，框架能对其结构进行优化

另外，我们在构建完计算图以后我们可以对其进行序列化，使其可以独立于代码运行

而动态图的优点是其非常好实现条件判断、循环等操作。这些操作在静态图中需要转换成专门的TF控制流操作符才能实现

现在TensorFlow也提出了自己的动态图实现方法，但是还是没PyTorch效果好

以下是动态图的一些应用场景

Caffe

Caffe在科研的时候用的相对较少，它让你基本不需要写代码就能实现一个神经网络，但相对的它让你很难对网络细节进行更改

以下是使用Caffe的基本步骤

第一步是转换数据格式

第二步是利用protext定义网络结构

对于非常大的网络利用Caffe来实现就会变得非常麻烦

第三步是定义Solver来定义网络中的参数

第四步是训练

Caffe有预训练模型与Python界面供我们使用

以下是Caffe的一些优缺点

Caffe2是最新的版本，对Caffe做了很多优化

我们可以看出google与facebook的思路完全不同。google希望能提出一个框架来满足所有应用场景，而facebook提出了两个框架来满足生产场景与研究场景的不同需求

以下是讲者对于选择不同神经网络框架的建议

博客等级

码龄7年

93
原创

289
点赞

1160
收藏

2249
粉丝

关注

私信

热门文章

分类专栏

笔记 1篇
三维重建 1篇
图神经网络 1篇
Unity3D 8篇
Reading Notes 4篇
OJ 32篇
VR 5篇
CUDA 6篇
图像处理 12篇
机器学习 12篇
CNN 14篇
环境配置 2篇
杂 3篇

展开全部收起

最新评论

数字图像处理笔记——阈值（Thresholding）
byte_ee: 大佬有代码吗，能再出一篇有代码的版本吗
快速理解图神经网络（GCN）
嵩哥迷弟: Out[6]还差一行[2, -2]没写出来
数字图像处理笔记——酉变换（ Unitary image transforms）
Орехов: DFT变换的系数矩阵A应该是正交矩阵，而不是酉矩阵吧，验证代码如下 [code=plain] H = 10; [k, n] = meshgrid(0:H-1); A = exp(-1i*2*pi*u.*x/H); % DFT变换的系数矩阵A E = A * A'; % A*A'的结果是对角矩阵，说明A是正交矩阵 not_E = A * conj(A'); % A*conj(A')的结果不是对角矩阵，说明A不是酉矩阵 [/code]
简单实例理解Unity世界坐标和局部坐标下四元数旋转（四元数乘法）
云上空: 四元数乘法旋转的本质是旋转的连续应用。当你执行p * q时，可以理解为首先应用四元数p的旋转，然后再应用四元数q的旋转。因此transform.rotation=transform.roation*quaterion可以解析如下: transform.rotation表示应用自身的旋转（也可以理解为将物体从默认旋转应用到transform.rotation），然后应用Quaternion旋转（也可以说是向自己施加quaterion旋转，一个意思），因此结果就是绕本地轴旋转了quaternion. 而transform.rotation=Quaternion*transform.rotation; 可以理解为对空间应用Quaternion旋转，对空间进行旋转也就是对空间坐标系的基进行旋转。也就是将整个空间朝某个方向旋转，然后在旋转后的空间中再应用transform.rotaion，因此就是绕世界轴进行了旋转。作为子物体时的四元数旋转：物体的localRotation其实就等于先应用父物体旋转，再应用本地旋转，也就是：transform.rotation = transform.parent.transform.rotation * transform.localRotation。但是我这里不打算通过这个来推断之后的局部旋转和全局旋转的异同关系。因为局部旋转的计算本质上依然是旋转的连续应用。局部坐标时,localRotation=loaclRotation*q和世界坐标的原理一样，也是先应用自身旋转然后应用q的旋转。结果便是绕自身坐标系旋转。而使用transform.localRotation=q*transform.localRotation也和之前一样。还是先对坐标系进行旋转，只不过这里旋转的是局部坐标系，然后再应用自身旋转，也就是自身绕着局部坐标系中的q进行了旋转。和世界坐标中的旋转原理一样，但是坐标系不同，结果自然不同。
Unity开发——Hololens2+Vuforia实现图像识别详细教程
Yxyrwx: 我运行之后不会出现在hololens中不会vuforia菜单，并且模型只会显示在一个浏览框里，不像官方给的例子那种可以在任意角度都能识别出来，这应该咋解决

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。