简单例子
笔者注
一般神经网络结构是,1.输入层 ;2.隐藏层(基本上可以认为是解决思路层);3.输出层。而隐藏层是解决问题的关键。
比如输入的原始信息有价格,运费,市场,材料 - 这是输入层;而由输入层利用激活函数算法分别推算出接受度,关注度,预期品质等第二层信息(第二层是隐藏层),再根据隐藏层的信息最终输出则是畅销度预测。
概念解析
1. 神经元层结构
- 隐藏层:3个神经元,接收4维输入特征
- 输出层:1个神经元,接收3维输入
- 输入层:4维特征(未标注层号)
2. 符号体系
- 上标方括号表示层号:
- 表示第1层第1个神经元的权重
- 表示第2层(输出层)的偏差
- 下标表示神经元序号:
- 表示第1层第3个神经元的激活值
计算流程详解
1. 隐藏层计算(第1层)
- 输入向量:
- 每个神经元计算:
笔者注:这里是举例,实际上的函数会因为需求而不同
其中为逻辑函数。
- 示例计算:
- 第1个神经元:
- 第2个神经元:
- 第3个神经元:
- 输出向量:
2. 输出层计算(第2层)
- 输入向量:
- 计算: 同上:这里是举例,实际上的函数会因为需求而不同
- 示例计算:
- 假设 ,
- 则
- (示例值)
3. 预测决策
- 最终输出:
- 阈值处理:(表示"畅销书")
关键机制分析
1. 激活函数作用
- 逻辑函数 将线性组合转换为非线性输出,实现多层网络的非线性表达能力。
2. 层级传递特性
- 权重矩阵维度匹配:
- 第1层:
- 第2层:
3. 参数学习过程
- 通过反向传播调整 和
,最小化损失函数(如交叉熵)。
实际应用场景 (简化)
1. 需求预测案例
- 输入特征:价格、季节、促销等4维数据。
- 隐藏层抽象特征:
- 神经元1:价格敏感度
- 神经元2:季节影响
- 神经元3:促销效果
- 输出层综合判断:最终预测销量概率。
总结
1. 层级结构:模块化构建复杂网络。
2. 矩阵运算:高效实现并行计算。
3. 非线性变换:通过激活函数实现。
4. 符号规范:层号与神经元序号的双重索引。
5. 预测流程:从原始数据到最终决策的完整路径。
笔者注
表示逻辑函数,
表示点积,
表示实数空间。上标方括号 [1] 表示层号,下标数字表示神经元序号。
稍微复杂一些的例子
核心概念
1. 层级结构
- 输入层(第0层):4维特征向量
- 隐藏层:3层(第1、2、3层),每层包含多个神经元
- 输出层(第4层):1个神经元(未在当前片段中展示)
2. 符号体系*
- 层号:用方括号上标表示,如 表示第3层权重
- 神经元序号:用下标表示,如 表示第3层第2个神经元的激活值
- 激活函数:默认使用逻辑函数
计算流程详解
第3层(隐藏层)计算
1. 输入:
第2层的激活向量
2. 参数:
- 权重矩阵:
- 偏差向量:
3. 激活计算:
对每个神经元 j
- 示例:
关键机制分析
1. 层级传递规律
- 第 层的激活值
由第
层的激活值计算得到:
- 矩阵维度匹配:
-
-
2. 激活函数作用
- 引入非线性变换,使网络能拟合复杂模式
- 输出范围 便于概率解释
3. 参数共享机制
- 同一层神经元共享相同的激活函数形式
- 不同神经元通过不同的 ,
学习不同特征
符号体系扩展
1. 输入层的符号统一
- 输入向量 记为
- 第1层激活值:
2. 通用公式
- 第 层第
个神经元:
实际应用场景
1. 图像分类任务
- 输入层:像素值(如 灰度图像展开为784维向量)
- 隐藏层:逐层提取边缘、纹理、形状等抽象特征
- 输出层:概率分布(如10类数字的分类结果)
2. 语言处理任务
- 输入层:词嵌入向量(如300维)
- 隐藏层:捕捉语法、语义关系
- 输出层:情感分析、命名实体识别等结果
注:很多情况代码库底层都封装了,有时候只掉用封装函数,但是原理需要知道。
总结
1. 层级计算模式:
2. 符号规范:
- : 第
层权重矩阵
- : 第
层偏差向量
- : 第
层第
个神经元的激活值
3. 激活函数选择:
- 逻辑函数(适用于二分类输出)
- ReLU、tanh等(适用于隐藏层)
笔者注:
表示点积,
表示实数空间。 上标方括号
表示层号,下标
表示神经元序号。 激活函数
统一表示逻辑函数,实际应用中可能替换为其他函数(如ReLU)。