引言
例子:房价预测
属于有监督学习

- 从给定输入和输出的训练即中学习输入和输出之间的映射函数,然后利用该映射函数预测出测试样本的输出值,其中训练集中的每个样本都由输入和对应的输出(也称之为label)组成(labeld data)
- 回归(Regression)——预测的目标值是数值型,连续变量
- 分类(Classification)——预测的目标值是离散的
01 回归与线性回归(Linear Regression Overview)
1.回归
- 根据自变量 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn以及因变量y的观测样本,去估计两者之间近似的函数关系 f f f
- 通常,假设函数 f f f的数学形式是已知的,但其中的若干个参数未知
- 通过自变量和因变量的观测样本去估计未知的参数值—— 参 数 回 归 \color{yellow}{参数回归} 参数回归
2.线性回归
- 函数 f f f是线性函数
- 机器学习中最简单的模型之一
- 线性回归方程的一般形式
y = w 0 + w 1 x 1 + w 2 x 2 + . . . + w n x n y=w_0+w_1x_1+w_2x_2+...+w_nx_n y=w0+w1x1+w2x2+...+wnxn,
其中W=[ w 0 w 1 w 2 . . . w n w_0w_1w_2...w_n w0w1w2...wn]为回归系数

一元回归
- 一个自变量,n=1
多元回归
- 有两个或两个以上的自变量,n>1
回归
- 求回归系数的过程
例——房价预测
- 目标值Price
- 一元回归问题
- 计算公式
- P r i c e = 0.2 ∗ S i z e \color{yellow}{Price=0.2*Size} Price=0.2∗Size
- 回归方程
- 0.2称为 回 归 系 数 \color{yellow}{回归系数} 回归系数
- P r i c e = 0.2 ∗ S i z e \color{yellow}{Price=0.2*Size} Price=0.2∗Size
多项式回归可转换为多元线性回归
-
一元m次多项式回归方程
y = w 0 + w 1 x + w 2 x 2 + . . . + w m x m y=w_0+w_1x+w_2x^2+...+w_mx^m y=w0+w1x+w2x2+...+wmxm
可转换为m元线性回归方程
y = w 0 + w 1 x 1 + w 2 x 2 + . . . + w m x m y=w_0+w_1x_1+w_2x_2+...+w_mx_m y=w0+w1x1+w2x2+...+wmxm
其中 x i = x i x_i=x^i xi=xi -
二元二次多项式回归方程
y = a 0 + a 1 x 1 2 + a 2 x 2 2 + a 3 x 1 x 2 + a 4 x 1 + a 5 x 2 y=a_0+a_1x_{1}^{2}+a_2x_{2}^{2}+a_3x_{1}x_{2}+a_4x_1+a_5x_2 y=a0+a1x12+a2x22+a3x1x2+a4x1+a5x2
可转换为5元线性回归方程
y = w 0 + w 1 z 1 + w 2 z 2 + w 3 z 3 + w 4 z 4 + w 5 z 5 y=w_0+w_1z_1+w_2z_2+w_3z_3+w_4z_4+w_5z_5 y=w0+w1z1+w2z2+w3z3+w4z4+w5z5
其中 z 1 = x 1 2 , z 2 = x 2 2 , z 3 = x 1 x 2 , z 4 = x 1 , z 5 = x 2 z_1=x_{1}^{2},z_2=x_{2}^{2},z_3=x_{1}x_{2},z_4=x_1,z_5=x_2 z1=x12,z2=x22,z3=x1x2,z4=x1,z5=x2
线性回归的一般方法
收集数据,采集训练样本,每个训练样本包括特征向量及其对应的期望输出
-
假设有n个已标记的样本数据, X i X_i Xi为第i个样本, y i y_i yi是该样本给定的期望输出
- 其中 X i = [ x 0 = 1 , x 1 , x 2 , . . . , x m ] X_i=[x_0=1,x_1,x_2,...,x_m] Xi=[x0=1,x1,x2,...,xm]
- 回归系数W=[w_0,w_1,…,w_m]
- 预测值 y i ′ = X i W y_i'=X_iW yi′=XiW
-
设 计 训 练 算 法 找 到 回 归 系 数 \color{yellow}{设计训练算法找到回归系数} 设

最低0.47元/天 解锁文章
910

被折叠的 条评论
为什么被折叠?



