【机器学习算法】之线性回归分析

最新推荐文章于 2025-07-29 19:58:43 发布

原创最新推荐文章于 2025-07-29 19:58:43 发布 · 981 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #算法

算法练习同时被 2 个专栏收录

72 篇文章

订阅专栏

机器学习

29 篇文章

订阅专栏

本文详细介绍了线性回归的基本概念及其在数学表达式中的简化形式，包括如何通过矩阵运算求解模型参数。进一步阐述了线性回归的局限性及如何通过局部加权线性回归进行改进，以应对复杂数据模型的需求。同时，提供了一个简洁的Python程序实现案例，展示了如何在实际场景中应用这些技术。

一.算法介绍

1.模型：y=xw
线性回归建立的模型非常简单，就是简单的线性组合。
2. 策略
使用平方损失函数：
这里写图片描述
3.算法
直接改写成矩阵相乘形式，即可得到闭式解。

上述是最基本的线性回归的用法，但是在实际应用中，从最基本的线性回归中还可以引申出多种形式。

局部加权线性回归：
参见博客 http://blog.youkuaiyun.com/silence1214/article/details/7764137
局部加权线性回归主要是用于解决线性回归模型太简单这个问题，往往实际需要拟合的模型不仅仅是线性模型这么简单。但是这种算法容易产生过拟合，而且计算复杂度较高。每次需要预测一个值的时候都需要遍历整个数据集来训练得到一个模型，这点比较像KNN。局部加权线性回归在损失函数里面加了一个权重矩阵，如下：

岭回归：
同样是修改损失函数，改成了如下形式：
这里写图片描述
以前上课的时候还以为这样做的目的是为了防止过拟合。但是想了一下，线性回归这么简单的模型，哪里会存在过拟合啊！实际上之所以引入是为了预防异常数据点的情况。平方损失函数对异常数据点还是很敏感的，当X不是列满秩时，或者某些列之间的线性相关性比较大时，的行列式接近于0，这时候求解得到的模型就很不稳定了。此时惩罚项就会起作用。
在实际应用中，数据的形式是多种多样的，数据的预处理还是很重要的。

二.python程序实现

def standRegres(xArr,yArr):
    xMat = mat(xArr); yMat = mat(yArr).T
    xTx = xMat.T*xMat
    if linalg.det(xTx) == 0.0:
        print "This matrix is singular, cannot do inverse"
        return
    ws = xTx.I * (xMat.T*yMat)
    return ws

代码实现也很简单