[学习笔记]机器学习——算法及模型（一）：线性回归

最新推荐文章于 2024-11-01 17:36:57 发布

大小姐的机器人

最新推荐文章于 2024-11-01 17:36:57 发布

阅读量583

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：算法模型机器学习 python

本文链接：https://blog.youkuaiyun.com/weixin_43317015/article/details/82910235

本文介绍了线性回归的基本概念，通过一个实例展示了如何建立目标函数，并探讨了似然函数和梯度下降法在求解最优参数中的作用。最后，提供了使用Python实现线性回归的代码示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

传统算法（一）：

线性回归

一、什么是线性回归

线性回归是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法，运用十分广泛。

举一个栗子数据：
工资和年龄（2个特征）
目标：预测银行会贷款给我多少钱（标签）
线性回归考虑：工资和年龄都会影响最终银行贷款的结果那么它们各自有多大的影响呢？（参数）

工资	年龄	额度
4000	25	12000
8000	28	15000
12000	35	20000
15000	40	25000

所以，通俗的解释就是：

x1,x2对应的就是工资和年龄两个变量，而y就是最终银行会批的额度；线性回归就是建立关于X与Y的一个方程式；

二、建立目标函数

接下来根据上面的例子，我们来建立目标函数

假设 $\theta_1$ 是年龄参数， $\theta_2$ 是工资参数

拟合的平面则为：

$h_\theta(X)=\theta_0+\theta_1x_1+\theta_2x_2$ $其中\theta_0是偏置项$

整合，可得如下：
$h_\theta(X) =\sum_{i=0}^n\theta_iX_i =\theta^TX$
当然真实值和预测值之间肯定是要存在差异的，这个称作“误差”

误差项：

公式中我们 $\varepsilon$ 用来表示该误差值，那可以进一步得到目标函数为：
$y^{(i)}=\theta^TX^{(i)}+ \varepsilon^{(i)}$
这里每一个 $i$ 都会对应有 $\varepsilon$ ，并且假设 $\varepsilon^{(i)}$ 均值为0，方差为 $\theta^2$ ，且服从高斯分布，也就是正态分布。