深度学习基础要点和Pytorch常用命令汇总

最新推荐文章于 2025-11-19 22:39:38 发布

原创

最新推荐文章于 2025-11-19 22:39:38 发布 · 1.9k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#Pytorch #深度学习 #机器学习 #人工智能 #神经网络

本文介绍了深度学习的基础，包括卷积、池化、优化算法如梯度下降法和Adam，以及Pytorch框架的使用，如损失函数、非线性层、torchvision模块和模型的保存与加载。此外，还涵盖了激活函数和数学运算的应用。

文章目录

深度学习基础

卷积

计算卷积后的图片size
$size=[\frac{l+2*p-k}{s}+1$ ]
其中：
$l = 图片原尺寸$
$p = p a d d i n g 大笑$
$k = 卷积核大小$
$s = 步长$

卷积参数个数
假设输入为388，输出为655，卷积核大小为333
那么因为输出有6个channel，所以需要6个333的卷积核

对于Pytorch可以用下面代码查看参数：

for name,parameters in net.named_parameters():
	print(name,':',paramaters.size())

卷积层激活函数
激活函数一般是在每次卷积后就使用

池化

计算池化后的图片size
方法同卷积操作

优化算法

梯度下降法

batch梯度下降法（batch_size=样本大小）当样本数小于2000
mini_batch梯度下降法（batch_size介于之间）样本数大于2000，一般batch_size设为64～512（2的倍数）
随机梯度下降法（batch_size=1）

$W:=W-\alpha*dW$

动量梯度下降 Momentum梯度下降

首先理解加权指数平均

$V_0=0$
$V_1=\beta*V_0+(1-\beta)*\theta_1$
$V_2=\beta*V_1+(1-\beta)*\theta_2$
$. . .$
$V_n=\beta*V_{n-1}+(1-\beta)*\theta_n$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。