神经网络学习笔记(一)

本文详细介绍了前馈神经网络的基本模型,包括神经元模型、网络架构,以及前馈神经网络的矩阵表示。文章还讨论了神经网络的训练,特别是代价函数的类型,如二元交叉熵、交叉熵和方差,并探讨了不同激活函数的作用,如Sigmoid、Softmax和ReLU等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、前馈神经网络基本模型

前馈神经网络是最基本的神经网络,其中的一些基本概念在神经网络的研究中被广泛的使用。

一个前馈神经网络可以看做是一个函数

fθ:xy
其中输入 xRn ,输出 yRm ,函数的行为通过参数 θRp 来决定。

构造一个神经网络,需要的各个要素如下:

1、神经元模型

神经元模型是构建神经网络的基本模块。神经元模型的要素如下:

  1. 每个神经元的输入为一个向量 xRn,输出为一个标量
  2. 决定神经元行为的参数包括一组权值向量 ωRn 和一个偏置项 b
  3. 每个神经元的输出可以表示为
    f(i=1nxiωi+b)
    其中f:RR 被称为激活函数
  4. 每个神经元需要满足以上三个条件,可以有多种数学形式。

2、神经网络的基本架构

神经网络的基本架构是以神经元为基础构建的层状网络。基本架构的要素如下:

  1. 神经元被组织成层状结构,每层的神经元数量根据需要设定。一层中神经元的个数被称为该层的宽度,每一层神经元的宽度不要求保持一致
  2. 最后一层神经元被称为输出神经元
  3. 输出神经元之前的各层神经元被称为“隐藏层
  4. 神经网络中包含的神经元层数被称为网络的深度
  5. 除了输入层外,每一层神经元以前一层神经元的输出网络输入
  6. 输出层神经元的输出作为整个神经网络的输出,是根据输出做出的预测或者判断
  7. 如前所述:一个前馈神经网络可以看做是一个函数fθ:xy ,函数的行为通过参数θRp 来决定。根据上面的要素,我们把参数 θ 叙述为所有神经元的权重 ω 和偏置 b
  8. 设计神经网络的一项重要工作就是设计网络的基本架构:即有多少层神经元,每层神经元的宽度。

3、前馈神经网络的矩阵表示

  1. 我们将输入用一个列向量 xRn 来表示,假设第一层神经元有 p1 个神经元,每个神经元有对应于输入向量的权重向量(行向量)ωRn,则p1个神经元的权重向量组成了一个矩阵ω1Rp1×n
  2. 第一层神经元的输出用一个列向量表示a1RP1,且有 a1=f(ω1x+b1),其中b1Rp1是第一层神经元的偏置向量(列向量)
  3. 第二层神经元的情况与第一层的类似,只是第二层神经元以第一层神经元的输出作为输入,即a2
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值