矩阵是线性代数中最基本、最重要的一个元素,同时也是机器学习中用来表征数据的主要手段。故而,本小节内容较多,我们将逐一展开介绍。首先,我们介绍矩阵的定义。
一、 矩阵
【定义1.2.1-矩阵】 给定正整数 m , n ∈ N m,n\in\mathbb{N} m,n∈N,我们将 ( m , n ) (m,n) (m,n)矩阵 A \bold{A} A定义为将 m ⋅ n m\cdot n m⋅n个元素 a i j a_{ij} aij(其中 i = 1 , . . . , m ; j = 1 , . . . . , n i=1,...,m;j=1,....,n i=1,...,m;j=1,....,n)按照 m m m行 n n n列的矩形依次排列的一个 m ⋅ n m\cdot n m⋅n元组。形如:
[ a 11 a 12 . . . a 1 n a 21 a 22 . . . a 2 n . . . . . . . . . a m 1 a m 2 . . . a m n ] , a i j ∈ R {\left[ \begin{array}{ccc} a_{11}&a_{12}&...&a_{1n}\\ a_{21}&a_{22}&...&a_{2n}\\ ...&...&&...\\ a_{m1}&a_{m2}&...&a_{mn} \end{array} \right]}, a_{ij}\in{\mathbb{R}} ⎣⎢⎢⎡a11a21...am1a12a22...am2.........a1na2n...amn⎦⎥⎥⎤,aij∈R
- 行向量: ( 1 , n ) − (1,n)- (1,n)−矩阵
- 列向量: ( m , 1 ) − (m,1)- (m,1)−矩阵
- 我们把 R m × n \mathbb{R}^{m\times n} Rm×n记为全部 ( m , n ) (m,n) (m,n)-矩阵的集合。
- 我们可以把 A ∈ R m × n \bold{A}\in\mathbb{R}^{m\times n} A∈Rm×n中的全部元素以列为单位堆积起来,进而转换(reshape)为一个长的列向量 a ∈ R m n \bold{a}\in\mathbb{R}^{mn} a∈Rmn。
二、矩阵加法与矩阵乘法
1. 矩阵加法法则: 矩阵 A ∈ R m × n \bold{A}\in\mathbb{R}^{m\times n} A