非线性问题:多项式回归
变量之间的线性关系
我们最常使用的线性是指“变量之间的线性关系(linear
relationship)”,它表示两个变量之间的关系可以展示为一条直线,即可以使用方 来进行拟合。要探索两个变量之间的关系是否是线性的,最简单的方式就是绘制散点图,如果散点图能够相对均匀地分布在一条直线的两 端,则说明这两个变量之间的关系是线性的。因此,三角函数( ),高次函数 ),指数函 数( )等等图像不为直线的函数所对应的自变量和因变量之间是非线性关系(non-linear relationship)。
也因此被称为线性方程或线性函数(linear function),三角函数,高次函数等也因此被称为非线性函数
(non-linear function)。
数据的线性与非线性
对于线性和非线性数据,最简单的判别方法就是利用模型来帮助我们——如果是做分类则使用逻辑回归,如果做回归则使用线性回归,如果效果 好那数据是线性的,效果不好则数据不是线性的。当然,也可以降维后进行绘图,绘制出的图像分布接近一条直线, 则数据就是线性的。