一.线性模型
1.定义
机器学习的线性模型是一种广泛应用的基础模型类型,它通过定义特征与目标变量之间的线性关系来进行预测或分类任务,这些模型都是把输入的特征 x 乘上一个权重,再加上一个偏置就得到预测的结果,形如y = b + wx
2.分段线性曲线
问题引入:
线性模型也许过于简单,x 跟 y 可能中间有比较复杂的关系
对于线性模型,x 跟 y 的关系就是一条直线,随着 x 越来越高,y 就应该越来越大。设定不同的 w可以改变这条线的斜率,设定不同的 b 可以改变这一条蓝色的直线跟 y 轴的交叉点
但是无论如何改 w 跟 b,它永远都是一条直线,永远都是 x 越大,y 就越大,这显然在现实中是不合常理的,也许 x 跟 y 中间,有一个比较复杂的、像红色线一样的关系
但不管如何设置 w 跟 b,永远制造不出红色线,永远无法用线性模型制造红色线。显然线性模型有很大的限制,这一种来自于模型的限制称为模型的偏差,无法模拟真实的情况
所以我们需要写一个更复杂的、更有灵活性的、有未知参数的函数。红色的曲线可以看作是一个常数再加上一群 Hard Sigmoid 函数。Hard Sigmoid 函数的特性是当输入的值,当 x 轴的值小于某一个阈值(某个定值)的时候,大于另外一个定值阈值的时候,中间有一个斜坡。所以它是先水平的,再斜坡,再水平的。所以红色的线可以看作是一个常数项加一大堆的蓝色函数(Hard Sigmoid),其中,常数项设成红色的线跟 x 轴的交点一样大
简单介绍:
红色线,即分段线性曲线可以看作是一个常数,再加上一堆蓝色的函数。
分段线性曲线可以用常数项加一大堆的蓝色函数组合出来,只是用的蓝色函数不一定一样。
如果分段线性曲线越复杂,转折的点越多,所需的蓝色函数就越多。
也许要考虑的 x 跟 y 的关系不是分段线性曲线,而是如图所示的曲线。可以在这样的曲线上