动手学深度学习笔记--LR_scratch

深度学习训练流程解析

最新推荐文章于 2025-07-05 22:35:54 发布

原创最新推荐文章于 2025-07-05 22:35:54 发布 · 3k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文详细解析了深度学习训练流程，包括数据集和批次数据集的构建，如何使用矢量图显示并设置图表尺寸，以及训练过程中参数w和b的初始化、线性函数定义、损失函数选择、优化算法应用等关键步骤。

作图

def use_svg_display():

# 用矢量图显示

display.set_matplotlib_formats('svg')

def set_figsize(figsize=(4.5, 2.5)):

use_svg_display()

# 设置图的尺寸

plt.rcParams['figure.figsize'] = figsize

set_figsize()#设置fig大小

plt.scatter(features[:, 1].asnumpy(), labels.asnumpy(), 1);

plt作图函数，use_svg_display函数和set_figsize函数定义在d2lzh中了，作图只要调用d2lzh.plt就行。只要调用d2lzh.set_figsize()就可以打印矢量图并设置图尺寸。

Class range(object)
range(stop) -->range object
range(start,stop[,step]) -->range object
自定义函数data_iter()解读
def data_iter(batch_size,features,labels):
        num_features = len(features)#知道features的数目
        indices = list(range(num_features))#建立索引
        random.shuffle(indices)#将索引打乱
      for I in range(0,num_features,batch):#以batch_size为步长建立batch
           j = nd.array(indices[i:min(i+batch,num_features)])#找到这一batch的样本索引
           yield features.take(j),labels.take(j)
'''
yield-->相当于一个generator.挺难理解的样子，下一篇专门来写吧

Numpy.take(a,indices,axis=None,out=None,mode='raise') https://docs.scipy.org/doc/numpy/reference/generated/numpy.take.html
其中a-->array源

indices-->要提取a中元素的索引
axis-->take元素的方式，axis = none 则按元素扫描，先行后列，如果axis = 0，

                 就按行扫描。如果axis = 1就按列扫描
ndarray.take与numpy.take有些许不一样
https://docs.scipy.org/doc/numpy/reference/generated/numpy.ndarray.take.html
ndarray.take(indices,axis=None,out=None,mode='raise')
               默认有两种形式，array.take(indices,axis)或者nd.take(source_array,indices,axis)
               其中，ndarray不按元素扫描，axis =none和axis=0效果一样，按行扫描，其中如果

indices超过了范围，就会默认取最后一行。同理axis=1按列取。

前面的步骤是建立一个数据集和batch训练集
下面是正式训练过程
第一步：因为是希望训练得到参数w,b。所以对w,b求导，故申请w,b的求导梯度内存
w.attach_grad()

b.attach_grad()

第二步：定义线性函数 nd.dot(X,w)+b
第三步：定义损失函数，用于判别训练效果，这里用的均方根损失函数
第四步：定义我们迭代学习的方法，这里用的是SGD，即小批量随机梯度下降算法。
第五步：训练，建立收敛后得到的w,b

【记录几个讨论区问题】

1.关于attach_grad，autograd一定要遵从原变量及其地址

2.autograd不支持

tracking my heart

博客等级

码龄7年

9
原创

3
点赞

23
收藏

1
粉丝

关注

私信

热门文章

上一篇：: 动手学深度学习笔记--autograd

下一篇：: ISO-V2原理图解析--GPIO

最新评论

VM ubuntu16.04与主机win10通信
优快云-Ada助手: 非常感谢优快云博主的分享，这篇博客对于想要在VM ubuntu16.04和主机win10之间实现通信的用户来说非常有帮助。我觉得下一篇博客可以探讨如何在VMware中配置桥接网络，进一步优化通信效率。相信这样的技术文章对其他用户也会很有用。希望博主能够继续分享关于VMware的相关技术，相信会有更多读者受益！为了方便博主创作，提高生产力，优快云上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.youkuaiyun.com/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.youkuaiyun.com/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
《Bag of Tricks for Image Classiﬁcation with Convolutional Neural Networks》阅读笔记
tracking my heart: 可以加载保留结构的预训练参数，新增参数初始化后训练
《Bag of Tricks for Image Classiﬁcation with Convolutional Neural Networks》阅读笔记
爱吃奶油蛋糕和果冻: 请问博主，ResNet50的三个结构改进之后是如何进行训练呢，不是从头开始训练的吧，是使用迁移学习的方法吗，具体是如何操作呢
virtualenv下配置gluon环境
smile*_*ing*: 很有用
virtualenv下配置gluon环境
smile*_*ing*: 感谢博主的分享

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。