深度学习的基础概念、基础的数学原理学习记录（二）

手写不期而遇

已于 2023-03-21 22:10:30 修改

阅读量822

点赞数

分类专栏：深度学习文章标签：深度学习机器学习人工智能

于 2022-01-17 21:37:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_43376782/article/details/122421731

版权

深度学习专栏收录该内容

2 篇文章

订阅专栏

反向传播用到的梯度下降原理数学公式

基本数学概念

函数： $f (x)$

导数： $f{}'(x)$

多元函数： $f (x, y)$

偏导数： $\frac{\partial f(x,y)}{\partial x},\frac{\partial f(x,y)}{\partial y}$

梯度：偏导数组成的向量集合
$\bigtriangledown f(x,y,z)=\frac{\partial f(x,y,z)}{\partial x},\frac{\partial f(x,y,z)}{\partial y},\frac{\partial f(x,y,z)}{\partial z}$

二元函数 $f(x,y)=x^{2}+y^{2}$ ,梯度是 $(2 x, 2 y)$
在点 $(1, 1)$ 处，梯度是 $(2, 2)$ ， $f (x, y)$ 沿该向量变化， $\bigtriangleup f(x,y)$ 变化最快！

所以，找到目标函数最小值（Loss)
$y{}'=kx+b$
均方误差是
$L=\frac{1}{2m}\sum_{i=1}^{m}(y-y{}')^{2}$
$m$ 个样本
因此需要找到合适的 $k, b$ 值，使 $L$ 最小，即找到 $k, b$ 值，使 $L{}'=0$

如果是一维 $L$ 函数，可以用 $L{}'=0$ 好求 $k$ 和 $b$
在卷积神经网络中，若使 $L{}'=0$ ，会得到很多 $k$ 和 $b$ ，因为 $k, b$ 太复杂了，干脆就让 $\theta$ 一点点变化，求 $L$ 最小值！ $\theta$ 代表的是 $[k, b]$ ，每次更新 $k, b$ 的值！
在这里插入图片描述

$\theta _{1}=\theta _{1}^{{}'}-\alpha \frac{\partial }{\partial\theta _{1}}J(\theta )$
新权值=当前权值-学习率*梯度
学习率一般为3，1，0.5，0.1，0.05，0.01，0.005，0.0001

可改变学习率的方法

学习率一开始可以大一点，后面小一点，这样更容易更快收敛！

学习率：Ir(learning rate)
                        x=x-Ir*dx
衰减：（decay）,decay是衰减因子！【常用的是指数衰减法】
                         $Ir=Ir_{strat}*1.0/(1.0+decay*i)$
                         $x = x - I r * d x$
动量：(momentum)
                         $\left\{\begin{matrix}x=x-Ir*dx+V*momentum\\ V=-Ir*dx \end{matrix}\right.$

手写不期而遇

博客等级

码龄7年

88
原创

384
点赞

1979
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: C++的设计模式---面向对象设计模式（开闭原则）

下一篇：: 线性代数Ax=b原理及工程上的应用

最新评论

Halcon深度学习常用算子及参数解释，完整流程（二）
m0_46066983: dev_open_window (0, 0, 512, 512, 'black', WindowHandle) *包含预处理数据参数的dict文件 PreprocessParamFileName:='E:/middle report/output_data_512_320/dl_preprocess_param_512_320.hdict' *检测神经网路的文件 RetrainedModeFileName:='E:/middle report/best_dl_model_detection.hdl' *设置类名 ClassNames:=['圆'] ClassIDs:=[0] *推理期间的批大小 BatchSizeInference:=1 *检测模型的后处理参数（不建议更改） MinConfidence := 0.6 MaxOverlap := 0.2 MaxOverlapClassAgnostic := 0.7 *推理可以在GPU或者CPU上运行 UseGPU := true if (UseGPU) get_system ('cuda_loaded', CudaLoaded) get_system ('cudnn_loaded', CuDNNLoaded) get_system ('cublas_loaded', CuBlasLoaded) if (not (CudaLoaded == 'true' and CuDNNLoaded == 'true' and CuBlasLoaded == 'true')) UseGPU := false endif endif *读取再训练模型 read_dl_model (RetrainedModeFileName, DLModelHandle) set_dl_model_param (DLModelHandle, 'batch_size', 1) if (not UseGPU) set_dl_model_param (DLModelHandle, 'runtime', 'cpu') endif set_dl_model_param (DLModelHandle, 'runtime_init', 'immediately') set_dl_model_param (DLModelHandle, 'min_confidence', MinConfidence) set_dl_model_param (DLModelHandle, 'max_overlap', MaxOverlap) set_dl_model_param (DLModelHandle, 'max_overlap_class_agnostic', MaxOverlapClassAgnostic) *获取用于预处理的参数 read_dict (PreprocessParamFileName, [], [], DLPreprocessParam) *创建显示结果的窗口字典 create_dict (WindowDict) create_dict (DLDataInfo) set_dict_tuple (DLDataInfo, 'class_names', ClassNames) set_dict_tuple (DLDataInfo, 'class_ids', ClassIDs) *为可视化设置参数 create_dict (GenParam) set_dict_tuple (GenParam, 'scale_windows', 1.2) *读取图像 open_framegrabber ('GigEVision2', 0, 0, 0, 0, 0, 0, 'progressive', -1, 'default', -1, 'false', 'default', 'c42f90fba890_Hikvision_MVCA01320GM', 0, -1, AcqHandle) set_framegrabber_param (AcqHandle, 'TriggerMode', 'Off') grab_image_start (AcqHandle, -1) *检测拍照得到的数据 *设置图像大小 zoom_image_size (GrayImage, ImageZoom, 512, 320, 'constant') dev_display (ImageZoom) gen_dl_samples_from_images (ImageZoom, DLSampleInference) preprocess_dl_samples (DLSampleInference, DLPreprocessParam) apply_dl_model (DLModelHandle, DLSampleInference, [], DLResultBatch) get_dict_tuple (DLResultBatch,'bbox_row1', BboxRow1) get_dict_tuple (DLResultBatch,'bbox_col1', BboxCol1) get_dict_tuple (DLResultBatch,'bbox_row2', BboxRow2) get_dict_tuple (DLResultBatch,'bbox_col2', BboxCol2) get_dict_tuple (DLResultBatch,'bbox_class_id', BboxClasses) tuple_length (BboxCol1, Length) gen_rectangle1 (Rectangle1, BboxRow1, BboxCol1, BboxRow2, BboxCol2) sub_image (GrayImage, ImageZoom, ImageSub, 1, 128) reduce_domain (ImageZoom, Rectangle1, ImageReduced)
海康工业相机SDK连接demo,Qt界面显示
手写不期而遇: 暂时没有哦
海康工业相机SDK连接demo,Qt界面显示
嘟嘟嘟嘟~、: 你好，有双目相机的嘛
Halcon傅里叶变换，算法加速，格式转换
优快云-Ada助手: 为什么要学算法？
Halcon分类----高斯混合模型GMM
优快云-Ada助手: 什么是P值？是否能系统讲解下。

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

手写不期而遇 感谢你的打赏，也欢迎一起学习

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。