深度学习._深度学习csdn-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_53983845/article/details/144937365

深度学习是什么?

深度学习是机器学习的一个子集：利用多层神经网络从大量数据中进行学习。即设计一个很深的网络架构让机器自己学。深度学习本质上就是找一个函数f的过程。x通过函数f映射到y。

神经网络

1.神经网络任务

输入的数据x，通过神经网络f 映射后，再输出y。如：

f （ x ） = y

f （身高，体重，财富） = 寿命

f （动漫人物的图片） = 人物名字

f （ “描述” ） = 图片

2.神经网络的输入

一般有三种数据形式：向量、矩阵/张量、序列

为什么说一张图片是由矩阵组成的？

我们都知道，图片的像素点是由R、G、B三色混合组成的。假设有一张100x100像素点的图片，每个像素点有R、G、B三通道，所以一张图片就是矩阵。

序列：是一种有序的组织方式，使事物之间有了明确的先后关系。例如：“我用的苹果”和“我吃的苹果”这两句话中的“苹果”的含义不相同。视频就是典型的序列，因为视频是由一帧一帧图片组成。不同的图片排放顺序可以构成不同的视频。

3.神经网络的输出

输出一般有以下三种类别：

1）回归任务（填空题）：所谓的回归任务就是猜一个数，例如：根据以前的温度推测明天的温度大概有多高

2）分类任务（选择题）：例如有A、B、C、D四个选项，在这四个选项中选一个

图片：猫 / 狗从猫 / 狗中选一个

句子：积极 / 消极从积极 / 消极中选一个

疾病：轻度 / 中度 / 重度从轻度 / 中度 / 重度选一个

3）生成任务（结构化）（填空题）：例如ChatGpt生成文本、图片。所有的结构化输出都是用类似于分类的方式实现的。

小练习：判断每个任务的输入和输出分别是什么？

深度学习任务

分类和回归是结构化的基础。

分类时，是用数字来表示类别。

有的时候需要多个模态（模态：例如有图有数据的任务）的数据，比如图片，文字，声音都是不同的模态。

神经元

在了解了输入和输出，来谈谈神经元：

大家都说深度学习需要数据，这是为什么？因为要从数据中找到函数。那么如何从数据中找到想要的函数：

1.定义一个函数（模型）

2.定义一个合适的损失函数

3.根据损失，对模型进行优化

我们自己先定义一个函数f' ，此时的函数f'和真实的函数f存在差距。我们的目标是要让f'尽可能的靠近真实函数f。定义一个合适的损失函数（loss函数），用来衡量定义的函数f'和真实函数f之间的差值有多大。根据损失（差值）对模型进行优化，通过数据一步一步更新，使得模型越来越靠近真实函数，最后得到真实函数。