吴恩达机器学习-第二章个人笔记-优快云博客

本文链接：https://blog.youkuaiyun.com/Aa20000113/article/details/109181719

吴恩达-机器学习第二章

2.1模型描述
2.2代价函数（平方误差函数）
2.3代价函数（1）
2.4代价函数（2）
2.5梯度下降算法
2.6梯度下降算法总结
2.7线性回归的梯度下降

2.1模型描述

①举例
在这里插入图片描述
监督学习中，我们有一个数据集（训练集），算法从数据集中得到相应的正确答案。本例中训练集就是关于房价的数据集，我们的工作就是从这个数据中预测出正确的房价。

②符号表示（定义）
m:表示训练样本的数量
x:表示输入变量或特征
y:表示输出变量（预测的内容）
(x,y):一个训练样本
(x⁽ⁱ⁾ ,y⁽ⁱ⁾):第i个训练样本
h（x）:由x到y的函数(假设函数）

2.2代价函数（平方误差函数）

在这里插入图片描述 假设函数：h_$\theta$(x)= $\theta$ ₀+ $\theta$ ₁x
我们所要做的就是确定 $\theta$ ₀和 $\theta$ ₁的值：
$\sum_{i=1}^m$ (h_$\theta$(x⁽ⁱ⁾)-y⁽ⁱ⁾)²这个式子最小时的 $\theta$ ₀和 $\theta$ ₁的值
也可以是使得J( $\theta$ ₀, $\theta$ ₁)= $\frac{1}{2m}$ $\sum_{i=1}^m$ (h_$\theta$(x⁽ⁱ⁾)-y⁽ⁱ⁾)²最小时的 $\theta$ ₀和 $\theta$ ₁的值

2.3代价函数（1）

在这里插入图片描述
为了简化运算，我们首先假设 $\theta$ ₀为0，只考虑 $\theta$ ₁：

这里我们看到当 $\theta$ ₁取1时，J( $\theta$ ₁)最小。（J( $\theta$ ₁)曲线是关于x=1对称的）

2.4代价函数（2）

我们同时考虑： $\theta$ ₁和 $\theta$ ₀
在这里插入图片描述
右图是等价线，同一条线上的J( $\theta$ ₀, $\theta$ ₁)相等（ J( $\theta$ ₀, $\theta$ ₁)图形是三维空间的对称碗状 );离中心越近J( $\theta$ ₀, $\theta$ ₁)越小。