5、线性模型:回归与分类的深入解析

线性模型:回归与分类的深入解析

1. 过拟合问题与模型选择

在机器学习中,过拟合是一个常见且棘手的问题。当模型在训练数据上表现出色,但在测试数据上却表现不佳时,这就是过拟合的明显迹象。为了避免过拟合,我们需要找到一种能够控制模型复杂度的方法。

1.1 岭回归(Ridge Regression)

岭回归是标准线性回归的一种常用替代方法。它同样是一种线性回归模型,预测公式与普通最小二乘法相同。不过,岭回归在选择系数 $w$ 时,不仅要考虑在训练数据上的预测效果,还增加了一个约束条件:希望系数的绝对值尽可能小,即所有 $w$ 的元素都接近 0。

这种约束被称为正则化,岭回归使用的是 $l_2$ 正则化。从数学角度来看,岭回归对系数的 $l_2$ 范数(即 $w$ 的欧几里得长度)进行惩罚。

以下是使用 sklearn 库中的 Ridge 类对扩展波士顿数据集进行岭回归的代码示例:

from sklearn.linear_model import Ridge
# 假设 X_train 和 y_train 是训练数据
ridge = Ridge().fit(X_train, y_train)
print("training set score: %f" % ridge.score(X_train, y_train))
print("test set score: %f" % ridge.score(X_test, y_test))

运行上述代码后,我们得到训练集得分 0

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值