自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

jier6的博客

原创 ACN(Auto-Compressing Networks)详解---ResNet？DenseNet？傻傻分不清

Auto-Compressing Networks这篇论文由雅典国立科技大学于2025年Nips发表。先来对比一下论文中给出的网络架构图1.网络架构图第一次听到这个ACN名称会觉得有些蒙，何来auto？何来compressing？这里就直接开门见山的给出答案。auto源于仅对架构进行更改，文章多次提到 through architectural design通过架构本身设计，就能咋样咋样...读者能否体会only这个词在这里体现出小得意的感觉？

2025-12-11 21:33:01 578

原创权重初始化的底层逻辑：从可学习参数的数值范围到梯度传递的全链路解析

如果你去问大语言模型，为什么要进行权重初始化？大概率会得到这样一个回答：参数初始化是为了给可学习参数一个合理起点：避免梯度消失 / 爆炸，让模型训练稳定；加速收敛，减少迭代次数；让各层参数同步更新，充分发挥网络能力。。既然涉及到参数更新，也就是说参数初始化，比如卷积层里的卷积核的参数，全连接层的参数，bn层里的放缩和偏移系数。所以“需要被更新” 是 “需要被初始化” 的前提，两者的对象完全一致。

2025-10-29 23:22:10 961

原创怒斩力扣热题100将（持续更新且自用）

力扣热题100，从小白视角出发进行代码讲解、思路讲解，希望可以帮助到大家。

2025-07-16 23:35:48 667

原创 alex、vgg、googlet的pytorch代码实现---附CNN常见问题汇总

alex、vgg、googlet的pytorch代码实现---附CNN常见问题汇总

2025-07-02 14:32:17 909

原创 CS231N笔记前部分拓展、深度学习入门知识-----正则化、优化器、基本分类器

对斯坦福cs231n课程前部分进行扩展、深入、理解。主要从k近邻分类器、线性分类器、正则化、优化器、全连接层这些方面进行细化拓展。可以说这些是每一个深度学习工作者的第一步也是必须走的一步。走好这步，在接下来学习cnn、rnn、transfrom等都会轻松很多。

2025-05-30 11:12:23 279 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除