深度学习基础知识

最新推荐文章于 2025-05-20 20:34:47 发布

chance_9841

最新推荐文章于 2025-05-20 20:34:47 发布

阅读量122

点赞数 2

分类专栏：深度学习pytorch 文章标签：深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/smile_chance/article/details/128593041

版权

深度学习pytorch 专栏收录该内容

3 篇文章

订阅专栏

关于深度学习的基础知识

文章目录

首先以线性回归入手。

引用《动手学深度学习（pytorch）》3.1.1.1 模型定义

一些名词

模型训练：就是通过学习寻找特定的模型参数值（在这个例子中就是 $w_1$ 和 $w_2$ 和b），使得数据上的误差尽可能小。
训练数据集：（training data set）或训练集（training set）
一个样本（sample）:一栋房屋
标签（label）:真实售出价格
特征（feature）:用来预测标签的两个因素,特征用来表征样本的特点。
损失函数（loss function）：衡量价格预测值与真实值之间的误差。有很多中损失函数，eg:平方误差函数，交叉熵函数…
解析解：比较简单的问题，可以直接用公式表达出
数值解：有限次的迭代，尽可能的降低损失函数的值，这类解叫做数值解
超参数（hyperparameter）：
1.∣B∣代表每个小批量中的样本个数（批量大小，batch size），
2.η 学习率（learning rate）并取正数。
这里的批量大小和学习率的值是人为设定的，并不是通过模型训练学出的，因此叫作超参数（hyperparameter）。我们通常所说的“调参”指的正是调节超参数，例如通过反复试错来找到超参数合适的值。

迭代过程
在这里插入图片描述

模型预测

训练完成后，我们得到了参数，w1，w2，b，这样我们就可以得到了一个方程，对于输入的（x1，x2），可以预测出其对应的y

线性回归简单的神经网络

在这里插入图片描述

特征数或特征向量纬度：输入的个数，在这里就是2。
**全连接层：**输出层中的神经元和输入层中各个输入完全连接。因此，这里的输出层又叫全连接层（fully-connected layer）或稠密层（dense layer）。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。