1、正则化线性回归
1.1、数据集的可视化
训练数据集:X表示水位变化的历史记录,y表示流出大坝的水量;
交叉验证数据集:Xval,yval;
测试数据集:Xtest,ytest;

其中,训练数据集12组,交叉验证数据集21组,测试数据集21组。

1.2、正则化线性回归损失函数

不对theta0进行惩罚,lambda为正则化参数。
补充函数linearRegCostFunction:
J = (X*theta-y)'*(X*theta-y)/(2*m)+...
(theta'*theta-theta(1)*theta(1))*lambda/(2*m);
计算得到:
J =
303.9932
1.3、正则化线性回归梯度
梯度计算公式为:

补充函数linearRegCostFunction:
grad = (X*theta-y)'*X(:,2)/m+lambda*theta/m;
grad(1) = (X*theta-y)'*X(:,1)/m;

本文介绍了正则化线性回归在处理数据集时的应用,包括数据集划分、损失函数和梯度计算。通过学习曲线分析了模型的偏差与方差问题,揭示了模型欠拟合的状态。接着引入多项式回归,讨论了过拟合现象,并通过选择合适的正则化参数λ找到了最佳模型。实验表明,λ=17时,模型表现最优。
最低0.47元/天 解锁文章
1299

被折叠的 条评论
为什么被折叠?



