正规方程

目录

1.正规方程

2.该如何选择使用哪个方法,他们的优缺点是什么?

3.正规方程在不可逆情况下的解决办法


1.正规方程

使用正规方程求\theta只需要一步就可以得到\theta的最优值,那么现在假设训练样本集中的m=4,可以得到下面一个表格,

在这个表格中,最终我们得到用矩阵x和向量y来计算\theta的方式

下面讲了当有m个训练样本时的情况,那么构建X即设计矩阵的方式如下

那么,在Octave中用这条语句来实现求最优化\theta即pinv(X'*X)*X'*y,其中X'代表的是X的转置

2.该如何选择使用哪个方法,他们的优缺点是什么?

使用正规方程是不需要特征缩放的

假如你有m个训练样本和n个特征变量时,使用梯度下降算法要选择学习速率a,通常要运行很多次,尝试不同的学习速率a找到运行效果最好的那个

同时使用梯度下降算法需要很多次的迭代,可能会使计算速度很慢。

而对于正规方程来说,不需要选择学习速率,很方便而且容易实现。但是如果特征变量的数量n很大的话,那么计算量就很大,速度就会变慢,

所以如果当n很大时,使用梯度下降法会比较快,但如果n比较小,那么使用正规方程就会比较好。

如果n超过一万,那么使用正规方程可能就会变慢。

3.正规方程在不可逆情况下的解决办法

如果你的X'X是一个不可逆的矩阵,那么你首先需要看你的特征向量里面有没有多余的特征,例如这种X1和X2是线性相关的,或者互为线性函数,如果有多余的向量可以删除两者之一,将会解决不可逆的问题。如果没有多余的特征需要检查是否存在过多的特征向量,如果不影响可以删除少数特征,解决这个问题。

 

 

 

### 正规方程法在机器学习与数学优化中的应用 #### 1. 正规方程法概述 正规方程是一种用于求解线性回归问题的解析方法,它通过矩阵运算直接计算出最优参数值。这种方法的核心在于通过对代价函数 \( J(\theta) \) 的偏导数设置为零来获得参数的最佳估计[^1]。 在线性回归中,假设输入数据集表示为矩阵 \( X \),目标变量为向量 \( y \),那么可以通过以下公式得到最佳参数 \( \theta \): \[ \theta = (X^T X)^{-1} X^T y \] 此公式的推导基于最小化均方误差的目标函数,并利用了矩阵微分的知识[^5]。 --- #### 2. 正规方程法的应用场景 正规方程法适用于小型至中型的数据集,在这些情况下,矩阵操作的时间复杂度是可以接受的。然而,当特征数量较大时(例如超过几万),由于需要计算逆矩阵 \( (X^T X)^{-1} \),时间复杂度会显著增加,因此不建议在这种情形下使用正规方程法[^4]。 以下是正规方程的一些典型应用场景: - **数据分析**:快速获取线性关系下的模型参数。 - **科学研究**:构建简单的因果关系模型。 - **工程实践**:处理低维空间内的预测任务。 --- #### 3. 正规方程的推导过程 正规方程的推导依赖于以下几个关键步骤: 1. 定义代价函数 \( J(\theta) \) 表达式: \[ J(\theta) = \frac{1}{2m} \sum_{i=1}^{m}(h_\theta(x^{(i)}) - y^{(i)})^2 \] 这里 \( h_\theta(x) = \theta^T x \)[^3]。 2. 将代价函数改写成矩阵形式: \[ J(\theta) = \frac{1}{2m} \|X\theta - y\|^2_2 \][^5]。 3. 对 \( J(\theta) \) 关于 \( \theta \) 求导并令其等于零: \[ \nabla_\theta J(\theta) = \frac{1}{m} X^T(X\theta - y) = 0 \][^5]。 4. 解得最终的正规方程表达式: \[ \theta = (X^T X)^{-1} X^T y \][^5]。 这一过程中涉及到了矩阵转置、矩阵乘法以及矩阵求逆等基本概念。 --- #### 4. 实现代码示例 下面是一个 Python 中实现正规方程法的小例子: ```python import numpy as np def normal_equation(X, y): theta = np.linalg.inv(X.T.dot(X)).dot(X.T).dot(y) return theta # 示例数据 X = np.array([[1, 1], [1, 2], [1, 3]]) y = np.array([1, 2, 3]) # 调用正规方程法 theta = normal_equation(X, y) print("Optimal parameters:", theta) ``` 这段代码展示了如何通过 NumPy 库完成正规方程的计算[^1]。 --- #### 5. 局限性和改进方向 尽管正规方程具有简单直观的优点,但它也存在一些局限性: - 当样本数量较多或维度较高时,\( (X^T X)^{-1} \) 的计算成本可能过高。 - 如果 \( X^T X \) 是奇异矩阵,则无法直接求逆,需采用正则化手段加以修正。 针对这些问题,梯度下降算法通常被作为一种替代方案提出,尤其是在大规模数据集中表现更为优越。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值