线性回归几乎是所有机器学习的入门课程,但是由于符号定义表达方式不同,造成了很多人在入门时期感觉跟多向量非常矛盾。比如所行向量还是列向量, x i \textbf{x}_i xi以及 x j \textbf{x}_j xj究竟是行还是列等等,本篇将先介绍向量以及列表相关的例子,然后再介绍线性回归的内容。
入门解惑
对于大多数教程而言,一份统计表的形式往往如下所示:
示例1:
示例1为默认格式,也是大多数博客或文章采用的格式。
属性1 | 属性2 | 属性3 | 属性4 | … | |
---|---|---|---|---|---|
元组1 | |||||
元组2 | |||||
元组3 | |||||
元组i | … | … | … | … | … |
采用向量描述:
属性1 | 属性2 | 属性3 | 属性4 | … | |
---|---|---|---|---|---|
元组i | x i 1 x_{i1} xi1 | x i 2 x_{i2} xi2 | x i 3 x_{i3} xi3 | x i 4 x_{i4} xi4 | … |
x i \textbf{x}_i xi代表行,但是并不能单纯地认为代表行的就是行向量,实际上大多数书籍或博客中默认都是列向量,如果有定义最好看清楚定义。
形如 x i = ( x i 1 , x i 2 , x i 3 , x i 4 , . . . x i n ) T \textbf{x}_i=(x_{i1},x_{i2},x_{i3},x_{i4},...x_{in})^T xi=(xi1,xi2,xi3,xi4,...xin)T是列向量
形如 x i = ( x i 1 , x i 2 , x i 3 , x i 4 , . . . x i n ) \textbf{x}_i=(x_{i1},x_{i2},x_{i3},x_{i4},...x_{in}) xi=(xi1,xi2,xi3,xi4,...xin)是行向量
属性j | … | |
---|---|---|
元组1 | x 1 j x_{1j} x1j | |
元组2 | x 2 j x_{2j} x2j | |
元组3 | x 3 j x_{3j} x3j | |
元组i | x i j x_{ij} xij | … |
x j \textbf{x}_j xj代表列,单纯地看表格实际上无法判断是否是列还是行向量,同样大多数默认是列向量,具体需要看定义。
形如 x j = ( x 1 j , x 2 j , x 3 j , x 4 j , . . . x n j ) T \textbf{x}_j=(x_{1j},x_{2j},x_{3j},x_{4j},...x_{nj})^T xj=(x1j,x2j,x3j,x4j,...xnj)T是列向量
形如 x j = ( x 1 j , x 2 j , x 3 j , x 4 j , . . . x n j ) T \textbf{x}_j=(x_{1j},x_{2j},x_{3j},x_{4j},...x_{nj})^T xj=(x1j,x2j,x3j,x4j,...xnj)T是行向量
其对应的具体实例:
编号 | 年龄 | 性别 | 身高 | 体重 | 电话 |
---|---|---|---|---|---|
1 | 18 | 男 | 180 | 80 | 18938298162 |
2 | 17 | 男 | 180 | 80 | 18938298152 |
3 | 15 | 男 | 180 | 80 | 18938298142 |
4 | 16 | 男 | 180 | 80 | 18938298132 |
5 | 14 | 男 | 180 | 80 | 18938294122 |
定义 x i = ( x i 1 , x i 2 , x i 3 , x i 4 , . . . x i n ) T \textbf{x}_i=(x_{i1},x_{i2},x_{i3},x_{i4},...x_{in})^T xi=(xi1,xi2,xi3,xi4,...xin