假设有一群老鼠,我们测量,并在二维坐标系中记录它们的身高以及对应的体重,这些点似乎都在某一条曲线的附近,但我们并不知道准确的方程式,所以我们可以使用两种机器学习的方法来估算它们的关系(直线和波纹线)。

我们要做的第一件事情是将数据划分成两个部分,一部分用作训练机械学习的算法,另一部分用作测试。


我们要使用的第一种机器学习算法是线性回归(Linear Regression),也称作“最小二乘法”。
但无论我们怎样调整直线的角度,由于直线不能包含弧度,线性回归直线永远捕获不了 Height 与 Weight 的真正关系。

本文探讨了机器学习中偏差、方差和过度拟合的概念。通过老鼠身高体重的例子,说明直线模型(低偏差,高方差)和波浪线模型(低方差,高偏差)的差异,强调了过度拟合问题,即模型过于复杂导致在测试数据上的表现不佳。
最低0.47元/天 解锁文章
341





