线性回归的原理

1.了解线性回归

先了解一些概念:监督学习、无监督学习、半监督学习、分类、回归、特征、标签
(1)特征:样本的输入,描述样本的一些属性,例如:西瓜的颜色、根蒂、声响等等
(2)标签:样本的输出,例如:在分类中,标签可以是西瓜的分类,例如好瓜、坏瓜(离散值);在回归任务中,标签可以是西瓜的含糖量(连续值)
(3)监督学习:训练数据包括样本的特征和标签,监督学习分为两种:分类和回归。
分类任务中预测的是离散值(再举一个例子:是否患病),回归任务预测的是连续值(房屋价格)。
(4)无监督学习:训练数据中只包含样本的一些特征,不包含标签,典型的无监督学习的例子是聚类。
(5)半监督学习:训练数据中有一部分样本是有标签的,而其余的是没有标签的,实际情况下没有标签的样本远多于有标签的样本。

那么究竟什么是线性回归?
西瓜书给出的解释:
在这里插入图片描述
通俗的理解:
现在我们手上有一堆数据(用于训练模型的数据,也称训练集),这些数据有自己的特征x和相应的输出标记y,而我们的目的是找出y跟x之间的一种线性关系,建

### 多元线性回归的工作机制及数学基础 多元线性回归是一种用于描述因变量 \( Y \) 和多个自变量 \( X_1, X_2, ..., X_n \) 之间关系的统计方法。它的目标是找到这些变量之间的最佳拟合直线方程,从而能够通过已知的自变量来预测未知的因变量。 #### 数学表达形式 多元线性回归模型可以表示为以下一般形式: \[ Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + ... + \beta_nX_n + \epsilon \] 其中: - \( Y \) 是因变量; - \( X_1, X_2, ..., X_n \) 是自变量; - \( \beta_0 \) 是截距项; - \( \beta_1, \beta_2, ..., \beta_n \) 是各自变量对应的系数; - \( \epsilon \) 是误差项,代表未被模型解释的部分[^3]。 #### 参数估计 为了得到最优的回归参数 \( \beta_0, \beta_1, ..., \beta_n \),通常采用最小二乘法 (OLS, Ordinary Least Squares) 来使残差平方和最小化。具体来说,定义残差平方和为: \[ SSE = \sum_{i=1}^{m}(y_i - (\beta_0 + \beta_1x_{i1} + \beta_2x_{i2} + ... + \beta_nx_{in}))^2 \] 通过对 SSE 关于各个参数求偏导并令其等于零,可以获得一组正规方程组,解此方程即可获得参数的最佳估计值[^4]。 #### 假设条件 多元线性回归的有效性和可靠性依赖于以下几个基本假设: 1. **线性关系**:因变量与自变量之间存在线性关系。 2. **独立性**:观测值相互独立。 3. **正态分布**:误差项服从均值为零、方差恒定的正态分布。 4. **同方差性**:对于所有的观察值,误差项具有相同的方差。 5. **无多重共线性**:自变量间不存在完全线性相关的关系[^1]。 #### 实现过程中的注意事项 在实际应用中,可能遇到一些问题影响模型性能,比如过拟合或欠拟合。可以通过引入正则化技术(如 Lasso 或 Ridge 回归)缓解这些问题。Lasso 回归不仅有助于减少复杂度,还能自动执行特征选择功能[^2]。 ```python from sklearn.linear_model import LinearRegression, Lasso # 创建线性回归实例 model = LinearRegression() # 训练模型 model.fit(X_train, y_train) # 输出回归系数和截距 print(f"Coefficients: {model.coef_}") print(f"Intercept: {model.intercept_}") # 如果需要使用Lasso回归 lasso_model = Lasso(alpha=0.1) lasso_model.fit(X_train, y_train) ``` 上述代码展示了如何基于 `scikit-learn` 库构建简单的线性回归以及带惩罚项的 Lasso 回归模型。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值