不进@则退-优快云博客

原创第三章 Sage-Husa自适应卡尔曼滤波

Sage-Husa自适应卡尔曼滤波

2024-11-21 11:56:28 740 1

原创第八章 Transformer代码详解

解析Pytorch Transformer代码实现

2024-09-27 17:19:24 2821

梯度消失问题( vanishing gradient)是在早期的BP网络中比较常见的问题。这种问题的发生会让训练很难进行下去，看到的现象就是训练不再收敛——Loss过早地不再下降,而精确度也过早地不再提高。梯度爆炸则是指梯度在反向传播过程中，由于链式求导法则的累乘效应，某些参数的梯度会变得非常大，导致参数更新过于剧烈，进而使得损失函数出现震荡现象。梯度消失指的是在反向传播过程中，由于链式求导法则的累积效应，随着网络层数的增加，梯度逐渐变小，导致参数更新缓慢甚至停滞，网络无法收敛。

2024-08-31 17:06:08 519

原创第三章卷积神经网络模型的发展

深度学习技术快速发展的过程中的一些经典模型

2024-08-28 11:38:49 1018

原创一、基本概念：并发、进程与线程

基本概念：并发、进程与线程

2024-08-27 09:23:33 948

原创第二章深度学习基础——层和函数

全连接、卷积、池化是深度学习网络模型的基本单元

2024-08-25 21:20:05 2104

原创第一章机器学习技术分类

机器学习技术分类

2024-08-23 15:42:48 832 2

weixin_43328663的博客

原创第三章 Sage-Husa自适应卡尔曼滤波

原创第二章线性卡尔曼滤波

原创第一章贝叶斯滤波

原创第九章目标检测中的Yolo v1

原创第七章 Transformer概述

原创第八章 Transformer代码详解

原创第六章深度学习中的注意力机制

原创第五章 MobileNet

原创第四章 ResNet