文章目录
1. 线性回归模型(最广泛)
1.1 房价预测的例子
- 线性回归: 预测出一条straight line,然后根据size预测price。
- 数据的呈现也可以是右边这个形式。
- training set训练集:给定的数据集。(如图)
- 为了测试机器学习算法的效果,通常使用两套独立的样本集:训练集和测试集。当机器学习程序开始运行时,使用训练集作为算法的输入,训练完成之后的那个东西叫模型,我们可以借助模型,通过输入测试集来预测目标变量。比较预测出来的目标变量和实际目标变量之间的差别,就可以算出算法的实际精确度。
- standard notation: I表示第I个训练例子。表示的index。
1.2 linear regression模型
- 例子:房子size-----f------price(prediction)
- 如何找到function f:
a. 通过linear regression找到function f(x)
2. cost function
- w,b是parameter,coefficients,weight
- w,b的变化会影响f(x)的值和对应的图像。
2.1 cost function公式
2.2 cost function理解
- model:f(x)=wx+b
- parameter: w,b
- cost function:
- goal: minimize J(w,b)
- 如何实现J(w,b)最小化(3点):
a. 通过f(x)—>J(w):假设b=0,固定w=1,找到f(x)的值以及通过f(x)的值找到对应的J(w)
b. 变化w的值,找出J(w)的图像
c. 通过J(w)的图像找出最小值,从而实现minimize J(w).
2.3 cost function 可视化
【不忽略b的话】
- J(w)的3D图像:
- 将3D图像2D化:使用等高线概念
a. 同一条线上的J(w)值相同。
b. 等高线图的中心点为最低点minimize。
- 可视化举例(3个例子)
-
- J(w)图上,点w=-0.15 b=800【J(w)值很大】对应的straight line是左图这样的。可以看出是非常不合适的straight line。误差很大。
-
- J(w)图上,点w=0 b=360【J(w)值相对小一点】对应的straight line是左图这样的。可以看出是这条straight line也不太合适。误差相对较大,但比上一个例子好一点。
-
- J(w)图上,点w=0.13 b=71【J(w)值很小】对应的straight line是左图这样的。可以看出是比较合适的straight line。误差很小。