- 博客(16)
- 收藏
- 关注
原创 机器学习(神经网络基础篇)——个人理解篇5(梯度下降中遇到的问题)
在神经网络训练中,计算参数的梯度是关键步骤。numerical_gradient 方法旨在通过数值微分(中心差分法)计算损失函数对网络参数的梯度。然而,该方法的实现存在一个关键问题,导致梯度计算错误。在梯度下降中,为什么需要对以前的权重系数进行保存,并且用更新后的数据进行梯度下降?在 数值微分(Numerical Gradient) 过程中,需要临时保存权重,以确保梯度计算的准确性。场景:通过中心差分法计算梯度时,需对参数的每个分量进行微小扰动(如±ε),观察损失的变化。
2025-04-07 10:54:41
494
原创 机器学习入门:一篇看懂核心概念与应用场景
定义:机器学习(Machine Learning, ML)是人工智能的核心分支,通过算法让计算机从数据中自动学习规律,并基于规律进行预测或决策。类比:就像人类通过经验学习知识,机器学习通过数据训练模型。就像教孩子识别动物:> - 你给他看100张猫狗图片(**数据**)> - 他总结出猫有尖耳朵、狗有长鼻子(**模型**)> - 看到新图片时就能判断是猫是狗(**预测**)
2025-03-27 16:48:17
137
原创 机器学习(神经网络基础篇)——个人理解篇3(概念+代码)
逻辑电路是数字电子系统的基础,通过基本逻辑门(与、或、非)组合实现特定的逻辑功能,广泛用于计算机、通信设备和控制系统。如图二,是三中基础逻辑门的介绍小总结逻辑电路是用电子开关实现的“布尔代数”,把“是/否”判断转化为物理信号,让机器学会“思考”。思考:为什么要介绍逻辑电路,和感知机有什么关系?其实就是用机器来代替人的一个逻辑推理的过程,让机器决定赋予多大的权重。学习是确定 合适的参数的过程,而人要做的是思考感知机的构造(模型)。感知机的局限性就在于它只能表示由一条直线分割的空间。
2025-03-26 14:51:55
618
原创 机器学习笔记---正向传播过程中参数的保存
现在我要实现一个二分类任务,采用四层神经单元(隐藏层数目+输出层数目),在定义好激活函数以及前向传播后,我需要将各个隐藏层中的参数进行保存,以便在后向传播过程中进行参数更新。
2025-03-18 15:24:20
282
原创 机器学习笔记---神经网络中的参数以及无偏估计概念
拿一个具有分类、回归任务的神经网络层来说(输入层、隐藏层、输出层三大基本结构)。比如输入的是好几张猫和狗的照片,目的是经过模型让系统自动输出是猫或者狗的概率(大于70%便认为可能性很大),利用神经网络非常强大的非线性拟合能力,于是便经过隐藏层中的神经单元所组成的“核”,提取一些边缘、固定特征,并以此为依据,进一步进行分析。简单的来说,就是把某些像素点(图像的基本单元),拿过来,根据0~255个不同的数字(表示黑到白不同的“色重”),组成一个个的矩阵形式,进行输入。
2025-03-14 17:26:43
577
原创 机器学习笔记---神经网络中正向传播和反向传播当的偏置以及权重的矩阵维数是什么?
在神经网络中,权重矩阵和偏置向量的维度仅取决于网络结构(相邻层的神经元数量),与训练集大小(批量大小 m)无关。
2025-03-10 11:15:30
260
原创 关于深度学习框架你知道哪些?
发布于2015年11月9日,作为的TensorFlow,多应用于图形分类、自然语言处理等场景,作为一款支持多移动平台(Windows、Linux、Os)、及具有大量与深度学习相关的API以及实施更新的算法库,而获得了广泛的关注。具体特点如下:1灵活性。将计算过程表示为一种数据流图的过程,采用计算图的方式建立计算网络的同时方便操作。2可移植性。TensorFlow可以在多个服务器、移动设备上进行运行。3算法库种类丰富。
2024-10-22 10:34:12
490
原创 Anaconda关于建立虚拟环境的原因以及机器学习中torch安装的环境与软件版本冲突问题的解决
所谓的虚拟环境相当于在一个固定体积的房间内进行切割,从而对于不同定义的空间赋予不同的功能。比如厨房负责炒菜,卧室负责起居......。同样的,不同的项目会对于Python的版本库提出不同的要求,同时又能保证各个子项目之间在相互协调的同时,不产生各种冲突且保证项目的可移植性。因此,虚拟环境的建立就显得很有必要了。解释:“ML”是你所创建虚拟环境的名称 ,后面就是指定python(解释器)的版本。
2024-10-22 09:57:49
1547
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人