- 博客(9)
- 收藏
- 关注
原创 【无标题】
本文探讨了深度学习训练中batch size的选择问题。Large batch训练速度更快,但容易陷入尖锐极小值(sharp minima),导致过拟合和泛化能力差;small batch由于梯度噪声的存在,能帮助跳出鞍点并找到平坦极小值(flat minima),具有更好的泛化性能。这种差异源于:1)small batch的噪声相当于隐式正则化;2)large batch更新方向过于确定,易过度拟合;3)平坦极小值对参数扰动不敏感,泛化能力更强。因此,尽管计算效率较低,small batch通常能获得更好
2025-09-15 10:57:41
343
转载 HDOJ杭电OJ 1001题
Problem DescriptionIn this problem, your task is to calculate SUM(n) = 1 + 2 + 3 + … + n.InputThe input will consist of a series of integers n, one integer per lineOutputFor each case, output SUM(n) in one line, followed by a blank line. You may assume
2023-03-20 15:41:10
322
原创 esp32在Arduino环境下“不存在或开发板没有连接问题
程序编译完出现Connecting…这时出错,显示选择的串口 For troubleshooting steps visit: https://docs.espressif.com/projects/esptool/en/latest/troubleshooting.html不存在或开发板没有连接。
2023-03-13 23:47:16
6347
3
原创 MATLAB绘图相关函数详解
MATLAB绘图相关函数详解快要考试了总结一下使用matlab绘图的一些东西x=0:pi/50:3pi; %x的范围和步长的定义y1=sin(0.6pix);%函数体subplot(2,1,1);%创建2行1列第一个图形plot(x,y1,'b’,‘linewidth’,2,‘markersize’,10);%绘制x关于y1的函数图像,蓝色型,线宽为2,特殊标记()尺寸为10xlabel(‘x’);%x轴添加标注xylabel(‘y’);%y轴添加标注ylegend(‘曲线y1’);%给
2020-06-09 17:22:17
749
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅