神经网络入门：从感知机到多层感知机（MLP）

最新推荐文章于 2025-11-05 13:33:27 发布

原创

最新推荐文章于 2025-11-05 13:33:27 发布 · 890 阅读

·

10

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#神经网络 #人工智能 #深度学习

翻开大多数深度学习教程，开篇总少不了那句：“神经网络模仿人脑神经元”。可问题是，别说普通人，就连学过生物的理工科人，也早把神经元知识忘得一干二净了。结果，本该帮助理解的类比，反而成了第一道认知门槛。

我们何不换条路？从你每天路过的奶茶店切入——把“模型学习”看作“调试奶茶配方”：

从只会做固定口味的“基础款计算器”（感知机）；
到能根据顾客反馈动态优化的“智能配方系统”（MLP）；
用人人都懂的消费体验，就能轻松理解神经网络的核心逻辑。

一、开篇：奶茶店老板的困惑 —— 固定配方满足不了所有顾客

小区里的奶茶店老板最近很头疼：他一直用 “固定配方” 做奶茶 —— 牛奶 200ml + 红茶 100ml + 糖 50g，热饮常温出品，只能加珍珠一种小料。
但顾客的需求越来越多样：

夏天有人要 “少糖 + 冰饮 + 椰果”，冬天有人要 “多糖 + 热饮 + 芋圆”；
年轻人爱 “浓茶 + 少奶”，上班族偏爱 “淡茶 + 多奶”；
甚至有人说 “加了芋圆就想少糖，加了椰果就想多冰”—— 这些复杂的偏好组合，靠手动改配方根本忙不过来。

老板的核心诉求很简单：能不能设计一套 “智能配方系统”？不用人工盯着改比例，只要输入顾客的基本偏好（比如 “年轻人 + 夏天 + 要芋圆”），系统就能自动算出该放多少牛奶、茶、糖，甚至推荐小料搭配。

二、回顾：传统模型的 “固定配方思维”—— 为什么满足不了多样需求？

在机器学习阶段，我们学的逻辑回归、SVM 等模型，本质上就是奶茶店的 “固定配方表”—— 用线性公式定义 “如何满足需求”，但面对复杂偏好时，很快就会失效。

比如老板想用逻辑回归预测 “顾客是否喜欢一款奶茶”，会得到这样的公式：
喜欢概率 = 牛奶量×0.4 + 茶浓度×0.3 + 糖量×0.3 + 温度系数×0.2 > 150 → 喜欢
（注：温度系数为 “冰饮 = 50，热饮 = 30”，数值越高代表越偏好该温度）

这个公式的问题很明显：

线性假设太死板：它默认 “牛奶量越多，喜欢概率就线性增加”，但现实中 “牛奶太多会腻”—— 超过 300ml 后，喜欢概率反而下降，这种 “先增后减” 的非线性关系，线性公式根本表达不了；
无法处理组合偏好：比如 “冰饮 + 少糖” 是强关联组合（夏天顾客选冰饮时，80% 会要少糖），但线性公式里 “温度” 和 “糖量” 是独立计算的，完全忽略了这种组合关系，就像给冰饮加了 50g 糖，顾客自然不满意；
新增需求要重写公式：如果老板想加 “茶底类型”（红茶 / 绿茶 / 乌龙茶）这个新特征，就得重新调整所有系数，相当于把之前的配方表全推翻，效率极低。

这就是传统模型的 “固定配方思维”—— 只能应对简单、单一的需求，一旦顾客偏好变得复杂，就会像 “用一款奶茶卖所有顾客” 一样，满意度直线下降。

三、感知机：“基础款奶茶的固定配比计算器”—— 神经网络的最小单元

要理解 MLP，得先从它的 “最小单元”—— 感知机（Perceptron）开始。它就像奶茶店刚开业时用的 “基础款配比计算器”，虽然简单，但能帮我们理解 “模型如何根据输入做决策”。

1. 感知机的工作逻辑：像调试 “基础款奶茶” 一样计算

假设老板用感知机判断 “顾客是否喜欢基础款奶茶”，整个过程分为 4 步：

第一步：确定 “输入”—— 要考虑哪些原料

感知机的 “输入（x）” 就是奶茶的核心原料用量：

牛奶用量 x₁（比如 200ml）；
茶浓度 x₂（比如 50%，数值越高越浓）；
糖量 x₃（比如 50g）。

第二步：设定 “权重”—— 原料的重要性

权重（w）代表 “顾客对每个原料的重视程度”。比如老板发现顾客更看重茶味，就给茶浓度更高的权重：

牛奶权重 w₁=0.3（一般重要）；
茶浓度权重 w₂=0.5（非常重要）；
糖量权重 w₃=0.2（不太重要）。

然后计算 “加权和”—— 相当于 “原料总得分”：
加权和 = x₁×w₁ + x₂×w₂ + x₃×w₃ + b
这里的 “b” 是偏置（Bias），相当于 “基础偏好分”—— 比如顾客默认喜欢热饮，所以加 10 分的热饮基础分（b=10）。

代入数值计算：
加权和 = 200×0.3 + 50×0.5 + 50×0.2 + 10 = 60 + 25 + 10 + 10 = 105

第三步：激活函数 —— 判断 “是否喜欢” 的开关

加权和是一个连续值（比如 105），但我们需要的是 “喜欢” 或 “不喜欢” 的明确结果。这时候就需要 “激活函数” 像 “判断开关” 一样，把连续值转换成离散决策。

最基础的激活函数是 “阶跃函数”：

如果加权和 ≥ 100 → 输出 1（顾客喜欢）；
如果加权和 < 100 → 输出 0（顾客不喜欢）。

上面的加权和是 105 ≥ 100，所以感知机输出 1—— 结论是 “顾客会喜欢这款基础款奶茶”。

第四步：感知机的本质 —— 不是 “智能”，而是 “固定规则计算器”

把整个过程抽象成公式，感知机的输出（y）就是：
y = f(x₁w₁ + x₂w₂ + x₃w₃ + b)
其中 f (・) 是激活函数（比如阶跃函数）。

它的核心是 “按固定权重和规则计算”，就像奶茶店的 “基础款配方计算器”—— 只能判断 “是否喜欢固定类型的奶茶”，一旦遇到 “冰饮 + 少糖”“热饮 + 多糖” 这种组合需求，就完全束手无策。

四、感知机的局限：“单配方计算器” 解不了 “多偏好需求”—— 对应异或问题

感知机能处理 “基础款奶茶的喜好判断”，但遇到 “多维度混合偏好” 时，就会陷入 “配方困境”—— 这对应神经网络中的经典难题：“异或问题（XOR）”。

1. 顾客的 “混合偏好”：像异或一样难搞

老板收集了 4 类顾客的偏好数据，想通过感知机判断 “是否喜欢定制款奶茶”，结果发现完全找不到合适的权重：

顾客类型	牛奶偏好（多 = 1 / 少 = 0）	茶偏好（浓 = 1 / 淡 = 0）	是否喜欢（标签）
A	0	0	0（不喜欢）
B	0	1

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。