qq_45810274-优快云博客

原创李沐动手深度学习09

交叉熵采用真实标签的预测概率的负对数似然。

2024-08-02 22:09:25 179

原创李沐动手深度学习08线性回归+基础优化算法

因为计算梯度是很贵的，它需要对每个损失函数求导，这个损失函数是对所有样本的平均损失，所以求梯度需要对所有样本算一次。小批量随机梯度下降是随机采样b个样本来近似损失，这里的b是批量大小，一个重要的超参数。b太小，则计算量太小，不适合并行来最大利用计算资源，b太大，内存消耗增加，浪费计算。

2024-07-24 23:08:11 461

原创李沐动手深度学习07自动求导

2024-07-19 00:10:45 191

原创李沐深度学习06矩阵计算

矩阵求导

2024-07-17 23:57:24 272

原创李沐深度学习笔记05线性代数

深度学习笔记

2024-07-14 17:49:29 402

原创李沐深度学习笔记04数据操作实现：

torch.Size([1, 3, 4])#一层3*4的矩阵[1., 1., 1., 1.]]])#这种就是2*3*4的有几个中括号就是几维内存的原地操作1.id变化的操作 Z = torch.zeros_like(Y) print('id(Z):', id(Z)) Z = X + Y print('id(Z):', id(Z))

2024-07-12 14:57:17 452

原创深度神经网络（DNN）

dnn的实现

2024-07-10 13:43:32 1003 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人