
深度学习
文章平均质量分 68
取名真难.
这个作者很懒,什么都没留下…
展开
-
深度学习 (正则化 权重衰减解决过拟合 欠拟合)
深度学习中的权重衰减(weight decay)是一种正则化技术,用于防止过拟合。它通过对模型的损失函数添加一个正则化项,来惩罚模型的权重参数。在权重衰减中,模型的损失函数会由原来的仅考虑预测误差部分改为考虑预测误差和权重的大小两部分。其中,预测误差部分衡量模型的拟合能力,而权重大小部分则衡量模型的复杂度。通过权重衰减,我们可以在保持模型的拟合能力的同时,尽量减小模型的复杂度,从而达到减小过拟合的效果。具体来说,权重衰减可以通过在损失函数中添加一个惩罚项来实现。通常,惩罚项采用L2范数(也称为欧氏距原创 2024-03-24 00:13:41 · 678 阅读 · 0 评论 -
深度学习(过拟合 欠拟合)
深度学习模型由于其复杂性,往往容易出现过拟合的问题。以下是一些深度学习中常见的过拟合原因和解决方法:1. 数据量不足:深度学习模型通常需要大量的数据来进行训练,如果数据量不足,模型容易过度拟合训练集。解决方法包括增加数据集的规模,或者使用数据增强技术来生成更多的数据样本。2. 模型复杂度过高:如果深度学习模型的层数或参数过多,模型容易过度拟合训练数据。解决方法包括减少模型层数,减少模型参数数量,或者通过正则化(如L1、L2正则化)加入额外的约束限制模型的复杂度。原创 2024-03-24 00:00:04 · 1257 阅读 · 0 评论 -
深度学习 (线性回归 简洁实现)
训练线性回归模型的目标是找到最优的权重和偏置项,使得模型预测的输出与真实值之间的平方差(即损失函数)最小化。在深度学习中,通过将多个线性回归模型组合在一起,可以构建更复杂的神经网络结构,以解决更复杂的问题。在线性神经网络中,线性回归是一种常见的任务,用于预测一个连续的数值输出。其目标是根据输入特征来拟合一个线性函数,使得预测值与真实值之间的误差最小化。其中,y表示预测的输出值,x1, x2, ..., xn表示输入特征,w1, w2, ..., wn表示特征的权重,b表示偏置项。原创 2024-03-23 16:34:11 · 816 阅读 · 0 评论 -
深度学习 线性神经网络(线性回归 从零开始实现)
定义模型"""线性回归模型"""#定义损失和函数"""均方损失"""#定义优化算法 """小批量随机梯度下降"""def sgd(params, lr, batch_size): #参数、lr学习率、原创 2024-03-23 16:33:30 · 834 阅读 · 0 评论 -
深度学习 (自动求导)
深度学习是一种机器学习方法,其使用神经网络模型来进行学习和预测。自动求导是深度学习中的一项重要技术,用于计算神经网络中各个参数对损失函数的偏导数。在深度学习中,我们通常使用一个损失函数来衡量模型的预测结果与真实值之间的差异。然后,我们通过调整神经网络中的参数,以最小化损失函数,从而改善模型的预测能力。自动求导是指计算某个函数的导数时,由计算机自动完成的过程。在深度学习中,我们需要计算损失函数对网络参数的偏导数,以便进行参数更新。由于神经网络的结构复杂且参数众多,手动计算这些偏导数是非常困难和耗时的。原创 2024-03-23 16:33:02 · 545 阅读 · 0 评论 -
深度学习预备知识(线性代数)
深度学习是一种机器学习的方法,涉及到大量的线性代数运算。线性代数是研究向量空间和线性映射的数学学科。在深度学习中,线性代数常用于表示和处理输入数据和模型参数。下面是一些深度学习中常见的线性代数概念和运算:1. 向量:在深度学习中,向量是一种表示数据的结构。它可以表示输入数据、模型参数和梯度等。向量通常用列向量表示,形如x = [x1, x2, ..., xn]。向量之间可以进行加法、减法和标量乘法等运算。2. 矩阵:矩阵是一个二维的数组,通常用于表示线性映射。原创 2024-03-10 13:33:56 · 1071 阅读 · 0 评论