自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 深度学习核心算法-梯度下降

优势:容易实现、适用范围广、可拓展性强(变异体包括:批量梯度下降(Batch Gradient Descent)、结合随机梯度下降(Stochastic Gradient Descent,SGD)、动量梯度下降(Momentum Gradient Descent)和Adam优化器)。简单来说,梯度下降的核心思想是:模型的参数通过不断调整,朝着减少预测误差的方向“下降”,即沿着误差函数的“梯度”方向移动。每一次迭代中,计算梯度、更新参数,并更新模型的预测结果,直到模型的性能达到预期或某种终止条件。

2025-02-24 16:09:14 444

原创 DeepSeek发展及创新

DeepSeek V2-V3及R1在模型架构上选择稀疏MoE模型而非稠密模型,并进行和积累了大量技术创新,包括MLA、FP8训练、MoE AIl-to-All通信瓶颈解决、MTP等这些技术并不是所有都是原始创新,但是能够进行如此多大模型架构底层创新的实验室,在全世界可能也只有少数几个;DeepSeek-R1-Zero:大规模RL训练,发现了RL训练的Scaling Laws,RL训练涌现“aha”时刻。推理模型蒸馏:将大模型推理能力蒸馏到小模型,优于小模型直接进行推理训练(规模效应)

2025-02-24 11:36:29 177

原创 深度学习框架的选择

深度学习框架的选择

2024-12-06 18:43:19 219

原创 罗技鼠标用后感

在旗舰店买的罗技304,一开始使用时确实感觉不错,但不到一年出现回转,102出现回转和双击问题,给售后打电话没有一个接的(真菜啊!

2024-04-11 11:13:07 313 1

原创 深度学习-python库的安装

python库的安装与卸载方法

2024-04-08 10:00:45 835

原创 故障诊断期刊总结

平均Review time: 108 days;

2024-04-03 21:39:17 6096 1

原创 深度学习-软件安装

我们将基于pycharm进行编写python程序

2024-04-03 15:34:54 538 1

原创 深度学习-学习基础

学习深度学习之前需要学会的一些理论知识

2024-04-02 21:01:24 323 1

原创 深度学习-入门理解

深度学习入门理解

2024-03-29 21:47:43 1026 2

原创 购物网站指南

购物网站比较,仅代表个人看法

2024-03-29 15:51:58 315 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除