深度学习（一）-神经网络为什么可以预测？_深度学习预测模块原理-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_21120275/article/details/100184827

本文通过一个训练好的神经网络模型，详细解析了神经网络预测过程，包括线性函数、激活函数的作用，以及如何通过多层神经元计算得出最终预测结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

特别申明：本文只做理解和说明，不够严谨，需要系统掌握还需专业学习

文章目录

一、引言

目前来说，很多大胸弟都已经听过神经网络的大名，对其牛X轰轰的能力表示惊叹，但对其为什么能够预测却总觉得是门玄学，莫名其妙。本文假设了一个已经训练好的网络来进行举例讲解。
那么它的模型到底是如何进行预测的呢？先回到神经网络的基本公式

二、公式回顾

$\tag{线性函数}$
$z=\sigma (y) \tag{激活函数}$

$x$ :输入数据的特征
$W$ :对应特征的权重
$b$ :偏移量，为了理解过程，下面的举例假设 $b = 0$
$z$ :预测结果

这里有的同学会有疑问：你拿一个线性函数就想搞定神经网络那么复杂的东东，怕是骗我的!! 这里不要担心啊，因为事实上只要两层的神经网络（使用了非线性的激活函数）就已经可以表示任意函数，可以适应n多种分类器了

三、举例说明

问题假设

我们已经训练好了一个模型，只要输入女生信息就可以判断某同学是否喜欢这个女生
模型输入信息：
(
$x_1$ 相貌评分，
$x_2$ 身材评分，
$x_3$ 性格评分
)
模型输出信息：
(
$z_1$ 喜欢
$z_2$ 不喜欢
)
$W$ :通过学习得到的重要参数，在这里可以理解为某同学对于输入女生特征的敏感程度

数学抽象解释

最简单的理解方式可以为:
$y=Wx=w_1*x_1+w_2*x_2+w_2*x_2$

w_1:对相貌敏感程度,假设某同学看脸，为0.5
w_2:对身材敏感程度，假设某同学无所谓，为0.1
w_3:对性格敏感程度，假设某同学喜欢性格好的，为0.4

假设有一位女同学的信息为{相貌：80分，身材50分，性格：90分}，预测某同学是否喜欢她
$y = 80 * 0.5 + 50 * 0.1 + 90 * 0.4 = 86$ 那么86分就是某同学给这位女同学的评分

神经网络图

假设该模型为两层的神经网络，隐藏层的四个小邪魔即为该同学内心的小九九，该神经网络具有以下特征：

灰色线条的权重假设都为0.1
小邪魔1对相貌和身材比较感兴趣，权重分别为0.6和0.3
小邪魔2对性格比较感兴趣，权重为0.8
小邪魔3对身材和性格比较感兴趣，权重分别为0.4和0.4
小邪魔4对身材比较感兴趣，权重为0.9
喜欢 的荷尔蒙对小邪魔1和小邪魔2搜集的信息比较信任，权重分别为0.6和0.2
不喜欢 的荷尔蒙对小邪魔2、小邪魔3和小邪魔4搜集的信息比较信任，权重分别为0.2、0.3和0.7

某同学的模型.png

预测

经过四个小邪魔的计算，得到如下表（基于上文的女同学数据）：

邪魔	$y = W x$ 得分	$\sigma (y)$ 得分(使用ReLU)
小邪魔1	$80 * 0.6 + 50 * 0.3 + 90 * 0.1 = 72$	$72$
小邪魔2	$80 * 0.1 + 50 * 0.1 + 90 * 0.8 = 85$	$85$
小邪魔3	$80 * 0.1 + 50 * 0.4 + 90 * 0.4 = 64$	$64$
小邪魔4	$80 * 0.1 + 50 * 0.9 + 90 * 0.1 = 62$	$62$

最后是时候由喜欢和不喜欢这两个决策者从小邪魔们收集的信息里面做决策了，根据两个家伙对四个小邪魔的信任程度，经过计算，得到如下表：

决策者	$ y=Wx$得分	$z=\sigma (y)$ 得分
喜欢	$72 * 0.6 + 85 * 0.2 + 64 * 0.1 + 62 * 0.1 = 72.8$	$\frac{72.8}{72.8+86.8}=45.61\%$
不喜欢	$72 * 0.1 + 85 * 0.2 + 64 * 0.3 + 62 * 0.7 = 86.8$	$\frac{86.8}{72.8+86.8}=54.39\%$