神经网络的矩阵基础
一、矩阵的基本概念
1. 矩阵的定义与类型
矩阵是一个按照长方阵列排列的复数或实数集合。在神经网络中,矩阵是表示和操作数据的基本结构。常见的矩阵类型包括:
- 方阵:行数和列数相等的矩阵,记作n×nn×nn×n矩阵。
- 行向量:只有一行的矩阵,可以看作是一个n×1n×1n×1的矩阵。
- 列向量:只有一列的矩阵,可以看作是一个1×n1×n1×n的矩阵。
- 单位矩阵:主对角线上的元素为1,其余元素为0的方阵,记作EEE或III。
2. 矩阵的例子
- 方阵例子:A=[1234]A = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}A=[1324]
- 行向量例子:v=[123]v = \begin{bmatrix} 1 & 2 & 3 \end{bmatrix}v=[123]
- 列向量例子:w=[456]w = \begin{bmatrix} 4 \\ 5 \\ 6 \end{bmatrix}w= 456
- 单位矩阵例子(3×3):E=[100010001]E = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix}E= 100010001
二、矩阵的基本运算
1. 矩阵的加法与减法
矩阵的加法与减法是对对应位置的元素进行加或减的运算。要求两个矩阵必须是同型矩阵(即行数和列数相同)。
公式:
Cij=Aij+BijC_{ij} = A_{ij} + B_{ij}Cij=Aij+Bij(加法)
Cij=Aij−BijC_{ij} = A_{ij} - B_{ij}Cij=Aij−Bij(减法)
例子:
A=[1234],B=[5678]A = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}, B = \begin{bmatrix} 5 & 6 \\ 7 & 8 \end{bmatrix}A=[1324],B=[5768]
A+B=[681012],A−B=[−4−4−4−4]A + B = \begin{bmatrix} 6 & 8 \\ 10 & 12 \end{bmatrix}, A - B = \begin{bmatrix} -4 & -4 \\ -4 & -4 \end{bmatrix}A+B=[610

最低0.47元/天 解锁文章
18

被折叠的 条评论
为什么被折叠?



