机器篇——线性回归公式图文代码相互结合详细讲解_线性回归方程公式详解图解-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_38299170/article/details/103520377

本文详细介绍了线性回归的理论基础，包括回归、中心极限定理、最大似然估计和概率密度函数。接着，探讨了一元和多元线性回归、梯度下降法以及正则化在防止过拟合中的应用。此外，还介绍了正则化方法，如Lasso和Ridge回归。最后，涵盖了广义线性回归的不同方法，如普通最小二乘法、Lasso、Ridge和弹性网络。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一.线性回归的相关理论

1.回归

大自然总是让我们回归到一定的区间之内。就好像，除了少数的伟人，我们绝大部分人会回归到平凡，成人普通人。而那些伟人很少，普通民众很多，整体分布就类似于正态分布图一样。这，也是我们回归的分布图。

在英雄的传记里面，英雄往往就那么几个人，而整个世界，基本是普通人。这，也是绝大部分人，都会被回归普通，回归平凡，那些英雄只是特例。

2.中心极限定理

(1).概率论中讨论随机变量序列部分和分布逐近于正态分布的一类定理

(2).这组定理是数理统计学和误差分析的理论基础，指出了大量随机变量累积分布函数逐点收敛到正态分布的积累分布函数的条件

(3).在自然界与生产中，一些现象受到许多相互独立的随机因素的影响，如果每个因素所产生的影响都很微小时，总的影响可以看作使你服从正态分布的。

3.最大似然估计

(1).最大似然估计是一种统计学方法，它用来求一个样本集的相关概率密度函数的参数。

(2).最大似然估计法明确的使用概率模型，其目标是寻找能够以较高概率产生观察数据的系统发生树。

(3).最大似然函数:

a.总体x为离散型时:(离散型，就用概率的方法算)

$\LARGE L(\theta) = \prod_{i = 1}^{m}p(x_{i}, \theta)$

$\LARGE lnL(\theta) = \sum_{i = 1}^{m}lnp(x_{i}, \theta)$

b.总体x为连续型时:(连续型，就用积分的方法算)

$\LARGE L(\theta) = \prod _{i = 1}^{m}f(x_{i}, \theta)$

$\LARGE lnL(\theta) = \sum _{i = 1}^{m}lnf(x_{i}, \theta)$

(4).对数似然函数:

对似然函数两边取对数，对 lnL(θ) 求导，并令之为0:

$\LARGE \frac{\partial lnL(\theta)}{\partial \theta} = 0$

解对数似然方程所得，即为未知参数的最大似然估计值。

4.概率密度函数

(1).在数学中，连续型随机变量的概率密度函数是一个描述这个随机变量的输出值，在某个确定的取值点附近的可能性的函数。

(2).而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。

(3).正太分布是重要的概率分布，它的概率密度函数是:

$\LARGE f(x) = \tfrac{1}{\sqrt{2\pi}\sigma }e^{-\tfrac{(x - \mu )^2}{2\sigma ^2}}$

$\LARGE \mu$ ：为正太分布中的误差期望，误差期望值越小越好，最好为0.

$\LARGE x$ ：为误差值， $\LARGE x_{i} = |y_{i} - \hat{y}_{i}|$ ， $\LARGE y_{i}$ 为真实值， $\LARGE \hat{y}_{i}$ 为预测值， $\LARGE x$ 等价于 $\LARGE \varepsilon$ ，即 $\LARGE x = \varepsilon$