自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 短文浅析大模型训练三个主要阶段

大模型的训练是一个复杂且多阶段的过程,涉及从基础的语言表示学习到针对具体任务的优化,再到根据人类反馈进一步调整模型行为。每个阶段都有其特定的目标和方法,共同构成了大模型训练的完整流程。

2025-01-06 12:53:27 290

原创 DAY15 神经网络的参数和变量

从数学上看,神经网络是一种用于数据分析的模型,这个模型是由权重和偏置确定的。像权重和偏置这种确定数学模型的常数称为模型的参数。除了参数以外,数据分析的模型还需要值根据数据而变化的变量,但是参数和变量都用拉丁字母或希腊字母标记,这会引起混乱。而区分用于代入数据值的变量和用于确定模型的参数,对于逻辑的理解是不可或缺的。

2025-01-05 16:59:16 1078

原创 三种常见神经网络模型(DNN、CNN、RNN)的区别与联系

DNN、CNN和RNN是三种常见的神经网络模型,它们在结构、功能和应用场景上存在显著的区别。DNN是一种通用的全连接网络结构,适用于处理各种类型的数据;CNN则专门用于处理具有网格状结构的数据,如图像和视频;RNN则适用于处理序列数据,如语音和自然语言文本。然而,它们之间也存在紧密的联系,可以相互结合使用以实现更强大的功能。在实际应用中,需要根据具体的任务和数据特点选择合适的模型或模型组合。

2024-12-29 14:20:32 2092 1

原创 Day14 最优化问题和回归分析

回归分析是一种预测性的建模技术,主要用于研究因变量(目标)和一个或多个自变量(预测器)之间的关系,其目的是通过建立模型来预测因变量的值。

2024-12-29 10:38:29 1101

原创 Day13 用Excel表体验梯度下降法

详见本Day文章顶部附带资源里里的Excel表《梯度下降法》,可以对照附表里的单元格公式进行理解,可以多尝试几次不同的学习率η来感受下一,只需要更改学习率η单元格数值,按回车键后即可观察函数值变化。

2024-12-22 22:27:11 588 1

原创 Day12 梯度下降法的含义与公式

梯度下降法(Gradient Descent)是一种广泛应用于机器学习和深度学习中的优化算法,主要用于求解最小化目标函数的问题。本Day在回顾前期基础上,形象具象抽象的讲解了梯度下降算法。

2024-12-21 23:28:22 905

原创 Day11 梯度下降法的基础:多变量函数的近似公式

解释多变量函数的近似公式,为理解梯度下降法打下基础

2024-12-18 23:38:35 673

原创 AI、大数据、机器学习、深度学习、神经网络之间的关系

一文讲解AI、大数据、机器学习、深度学习、神经网络之间的关系

2024-12-17 23:09:21 1512

原创 Day10 误差反向传播法必需的链式法则

在神经网络的训练过程中,误差反向传播法是一种非常重要的算法。它通过计算损失函数对每个参数的梯度,从而更新参数以最小化损失函数。而在这个过程中,链式法则起到了至关重要的作用。本Day将深入探讨神经网络和复合函数的关系、单变量与多变量函数的链式法则。

2024-12-17 22:45:22 1061

原创 Day9 神经网络的偏导数基础

分享解释学习神经网络需要的偏导数基础

2024-12-16 22:59:58 1423

原创 Day8 神经网络中的导数基础

神经网络中的导数基础

2024-12-15 23:45:28 786

原创 Day7 神经网络的矩阵基础

神经网络的矩阵基础

2024-12-13 22:48:57 1206

原创 Day6 神经网络的向量基础

总结学习神经网络需要掌握的向量基础知识

2024-12-12 23:38:35 732

原创 Day5 神经网络的数列和递推关系式基础

深度学习神经网络中常用到的数列和递推关系式基础。附常见的符号解释

2024-12-11 21:43:59 542

原创 Day4 神经网络的函数基础

深度学习神经网络需要掌握的函数基础

2024-12-10 22:00:13 939

原创 Day3 用恶魔来讲解神经网络

Day2中概述了神经网络的各层(输入层、隐藏层、输出层),但没有具体介绍其中最难的。这是因为隐藏层肩负着**特征提取(feature extraction)**的重要职责,需要很长的篇幅来介绍。Day3中以“恶魔组织”为例,从隐藏层切入,解释整个神经网络的“工作”机制。

2024-12-09 22:08:30 733

原创 Day2 神经网络中的 激活函数 和 网络层次

Day2 神经网络中的 激活函数 和 各层网络神经元工作的一般化简化神经元图形激活函数根据点火与否,生物学上的神经元的输出 y 分别取值 1 和 0回顾 Day1 中利用单位阶跃函数表示的点火公式:u(z)={0(z<0)1(z≥0) u(z) = \begin{cases} 0 & (z < 0) \\ 1 & (z \geq 0) \end{cases} u(z)={01​(z<0)(z≥0)​y=u(w1x1+w2x2+w3x3−

2024-12-08 11:58:54 749

原创 Day1 从生物学到数学 解释 神经网络中的神经元

5张图解释 神经网络中神经元工作的数学表示

2024-12-07 14:00:44 668

原创 解释版:终端、命令行、命令行工具、命令行解释器之间的关系

通过观察命令行行为的特征,你可以大致判断终端使用的是哪种Shell。:在实际使用中,用户打开终端,然后在终端中启动命令行解释器(如Bash或PowerShell)。接着,用户可以在命令行解释器中输入命令,调用命令行工具,执行各种任务。:终端是用户与计算机交互的接口,而命令行解释器是运行在终端上的程序,用于解释和执行用户输入的命令。在某些情况下,你可以通过检查终端进程的父进程或相关进程信息来确定使用的Shell类型。通过这个路径,你可以判断终端使用的是哪种Shell。,那么使用的是C Shell或其变种。

2024-12-02 21:54:13 678

原创 中英对照简易学习:终端、命令行、命令行工具、命令行解释器之间的关系

一、终端、命令行、命令行工具、命令行解释器之间的关系终端:命令行:命令行工具:命令行解释器:二、常用命令行工具三、常见命令行解释器Learning Notes: Relationships Among Terminal, Command Line, Command Line Tools, and Command Line InterpretersI. Relationships Among Terminal, Command Line, Command Line Tools, and Command Lin

2024-12-02 21:51:46 519

用Excel表体验梯度下降法

用Excel表体验梯度下降法

2024-12-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除