- 博客(20)
- 收藏
- 关注
原创 短文浅析大模型训练三个主要阶段
大模型的训练是一个复杂且多阶段的过程,涉及从基础的语言表示学习到针对具体任务的优化,再到根据人类反馈进一步调整模型行为。每个阶段都有其特定的目标和方法,共同构成了大模型训练的完整流程。
2025-01-06 12:53:27
290
原创 DAY15 神经网络的参数和变量
从数学上看,神经网络是一种用于数据分析的模型,这个模型是由权重和偏置确定的。像权重和偏置这种确定数学模型的常数称为模型的参数。除了参数以外,数据分析的模型还需要值根据数据而变化的变量,但是参数和变量都用拉丁字母或希腊字母标记,这会引起混乱。而区分用于代入数据值的变量和用于确定模型的参数,对于逻辑的理解是不可或缺的。
2025-01-05 16:59:16
1078
原创 三种常见神经网络模型(DNN、CNN、RNN)的区别与联系
DNN、CNN和RNN是三种常见的神经网络模型,它们在结构、功能和应用场景上存在显著的区别。DNN是一种通用的全连接网络结构,适用于处理各种类型的数据;CNN则专门用于处理具有网格状结构的数据,如图像和视频;RNN则适用于处理序列数据,如语音和自然语言文本。然而,它们之间也存在紧密的联系,可以相互结合使用以实现更强大的功能。在实际应用中,需要根据具体的任务和数据特点选择合适的模型或模型组合。
2024-12-29 14:20:32
2092
1
原创 Day14 最优化问题和回归分析
回归分析是一种预测性的建模技术,主要用于研究因变量(目标)和一个或多个自变量(预测器)之间的关系,其目的是通过建立模型来预测因变量的值。
2024-12-29 10:38:29
1101
原创 Day13 用Excel表体验梯度下降法
详见本Day文章顶部附带资源里里的Excel表《梯度下降法》,可以对照附表里的单元格公式进行理解,可以多尝试几次不同的学习率η来感受下一,只需要更改学习率η单元格数值,按回车键后即可观察函数值变化。
2024-12-22 22:27:11
588
1
原创 Day12 梯度下降法的含义与公式
梯度下降法(Gradient Descent)是一种广泛应用于机器学习和深度学习中的优化算法,主要用于求解最小化目标函数的问题。本Day在回顾前期基础上,形象具象抽象的讲解了梯度下降算法。
2024-12-21 23:28:22
905
原创 Day10 误差反向传播法必需的链式法则
在神经网络的训练过程中,误差反向传播法是一种非常重要的算法。它通过计算损失函数对每个参数的梯度,从而更新参数以最小化损失函数。而在这个过程中,链式法则起到了至关重要的作用。本Day将深入探讨神经网络和复合函数的关系、单变量与多变量函数的链式法则。
2024-12-17 22:45:22
1061
原创 Day3 用恶魔来讲解神经网络
Day2中概述了神经网络的各层(输入层、隐藏层、输出层),但没有具体介绍其中最难的。这是因为隐藏层肩负着**特征提取(feature extraction)**的重要职责,需要很长的篇幅来介绍。Day3中以“恶魔组织”为例,从隐藏层切入,解释整个神经网络的“工作”机制。
2024-12-09 22:08:30
733
原创 Day2 神经网络中的 激活函数 和 网络层次
Day2 神经网络中的 激活函数 和 各层网络神经元工作的一般化简化神经元图形激活函数根据点火与否,生物学上的神经元的输出 y 分别取值 1 和 0回顾 Day1 中利用单位阶跃函数表示的点火公式:u(z)={0(z<0)1(z≥0) u(z) = \begin{cases} 0 & (z < 0) \\ 1 & (z \geq 0) \end{cases} u(z)={01(z<0)(z≥0)y=u(w1x1+w2x2+w3x3−
2024-12-08 11:58:54
749
原创 解释版:终端、命令行、命令行工具、命令行解释器之间的关系
通过观察命令行行为的特征,你可以大致判断终端使用的是哪种Shell。:在实际使用中,用户打开终端,然后在终端中启动命令行解释器(如Bash或PowerShell)。接着,用户可以在命令行解释器中输入命令,调用命令行工具,执行各种任务。:终端是用户与计算机交互的接口,而命令行解释器是运行在终端上的程序,用于解释和执行用户输入的命令。在某些情况下,你可以通过检查终端进程的父进程或相关进程信息来确定使用的Shell类型。通过这个路径,你可以判断终端使用的是哪种Shell。,那么使用的是C Shell或其变种。
2024-12-02 21:54:13
678
原创 中英对照简易学习:终端、命令行、命令行工具、命令行解释器之间的关系
一、终端、命令行、命令行工具、命令行解释器之间的关系终端:命令行:命令行工具:命令行解释器:二、常用命令行工具三、常见命令行解释器Learning Notes: Relationships Among Terminal, Command Line, Command Line Tools, and Command Line InterpretersI. Relationships Among Terminal, Command Line, Command Line Tools, and Command Lin
2024-12-02 21:51:46
519
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人