
深度学习框架
文章平均质量分 70
NCU_wander
这个作者很懒,什么都没留下…
展开
-
Linux查看CUDA版本以及nvcc: command not found
在日常使用中,在配置镜像以及使用开源网站时经常需要查询CUDA版本,版本也确实十分的重要。一般的我们有三种常见的查询方式。原创 2023-03-20 15:33:49 · 7909 阅读 · 3 评论 -
Pytorch退火学习率和num_wrokers
在训练deeplabv3+的语义分割网络过程中遇到了加速训练以及退火学习率的应用,在本文中对相关知识进行记录,防止后面会有忘记。1、退火学习率在训练神经网络时,一般情况下学习率都会随着训练而变化,这主要是由于,在神经网络训练的后期,如果学习率过高,会造成loss的振荡,但是如果学习率减小的过快,又会造成收敛变慢的情况。因此,如何调整学习率也是一个值得讨论的问题。目前,比较常见的学习率退火方式有如下三种:随步数衰减比较常见的随步数衰减方式是每经过5个epoch学习率减小为一半,或者每经过20个epoc原创 2020-11-06 10:53:55 · 282 阅读 · 0 评论 -
由Super初始化展开的深度学习forward问题
最近在改写网络的过程中,发现自己对于super()继承的概念掌握的不清楚,引发了网络训练的相关似是而非的问题,有意思的是到目前位置这些问题仍然有待于理清。另外本次完成关于深度学习网络的第一次改写,整体还是比较顺利的,但是也暴露出对于深度学习库相关语法的不熟悉,有待进一步加强掌握。1、super及其背后的类继承方法1.1 super与单继承、多继承super() 函数是用于调用父类(超类)的一个方法。而且:Python3.x 和 Python2.x 的一个显著区别是:Python 3 可以使用直接使用原创 2020-10-16 10:45:00 · 709 阅读 · 0 评论 -
Fastai/Pytorch 的 BCEWITHLOGITSLOSS/AdaptiveLoss
最近在学习一篇有关于fastai的鉴别器知识,整理相关的有意思的可以学习的点。1、鉴别器结构def custom_gan_critic( n_channels: int = 3, nf: int = 256, n_blocks: int = 3, p: int = 0.15): "Critic to train a `GAN`." layers = [_conv(n_channels, nf, ks=4, stride=2), nn.Dropout2d(p / 2)] f原创 2020-08-15 15:28:22 · 381 阅读 · 0 评论 -
pytorch - CUDA devices设置
1、numpy.cuda 而非 numpy.gpu为什么将数据转移至GPU的方法叫做.cuda而不是.gpu,就像将数据转移至CPU调用的方法是.cpu?这是因为GPU的编程接口采用CUDA,而目前并不是所有的GPU都支持CUDA,只有部分Nvidia的GPU才支持。PyTorch未来可能会支持AMD的GPU,而AMD GPU的编程接口采用OpenCL,因此PyTorch还预留着.cl方法,用于...原创 2020-04-27 16:09:57 · 1749 阅读 · 0 评论 -
Pytorch 模型保存与使用、Finetune参数冻结、train/eval
pytorch是一个非常好用的模型,值得花时间去理解去搞一搞。1 模型保存与使用torch.save:将对象序列化到硬盘上,该对象可以是 Models, tensors和 dictionaries 等。实际上是使用了python的 pickle方法。torch.load:将硬盘上序列化的对象加载设备中。实际是使用了pickle的解包方法。torch.nn.Module.load_state...原创 2019-11-29 11:38:18 · 1251 阅读 · 0 评论 -
Caffe安装 It requires a deb-src line in your sources.list.
最近因为工程需要,在本机安装Caffe环境,不得不说目前Caffe、Tensorflow、Pytorch的安装进一步简化,对于用户的友好度大幅度提升。实际上显而易见的是这个世界,懒惰是第一生产力,任何将功能复杂化的东西最后都必定会失去对普罗大众的吸引力,无法成为dominant的产品。以CPU version为例:sudo apt install caffe-cpusudo apt buil...原创 2019-12-12 16:51:00 · 721 阅读 · 0 评论 -
TensorFlow入门session/placeholder/variable
TensorFlow中的几个重要的入门概念,转载自https://www.jianshu.com/p/85e4a3a5a598先看下面一段代码:尽管已经创建了一个input tensor( [5, 3] )以及一系列操作(tf.reduce_prod, tf.reduce_sum, tf.add),可是并不能马上看到结果,这是我第一次接触TF时最不习惯的地方。究竟怎样才能运行这个graph,...原创 2019-08-27 20:24:48 · 149 阅读 · 0 评论