回归小结

本文介绍了回归分析的基本概念,对比了回归与分类的区别,并详细解释了如何通过最小化误差平方和来确定最佳回归系数。此外,文章还探讨了在样本数量不足时如何采用岭回归等方法解决实际问题,并介绍了评估模型好坏的指标——预测值与实际值的相关性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

      与分类一样,回归也是预测目标值的过程。回归与分类的不同点在于,前者是预测连续型变量,而后者是预测离散型变量。在回归方程中,求得特征对应的最佳回归系数的方法是最小化误差平方和法,给定输入矩阵X如果的逆矩阵存在并且可以求得的话,回归法就可以直接使用,数据集上计算的回归方程不一定是最佳的,可以使用预测值yHat和原始值y的相关性来度量回归方程的好坏。当数据的样本数比特征数还少时候,矩阵的逆不能直接计算。这是应该考虑使用岭回归,因为即使的逆矩阵不能计算,它仍能保证求得回归系数。

岭回归是缩减法的一种,相当于对回归系数的大小施加了限制。另一种很好的缩减法是lasso由于lasso难求解,但可以使用简便的逐步线性回归的方法来求的近似结果。特别提出,方差是指模型之间的差异,而偏差是指模型预测值和真实值之间的差异。偏差、方差折中是一个重要的概念,可以帮助我们理解现有模型并做出改进。






评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值