机器学习入门:线性回归、误差计算与集成方法
1. 线性回归基础
在机器学习中,我们常常先假设数据可以用一条直线很好地拟合,而寻找“最佳拟合”直线的常用技术是最小化均方误差(MSE)。
在欧几里得平面中,直线具有无限长度。若选取直线上两个不同的点,这两点间的所有点构成线段;若选取一个端点,直线一侧的所有点构成射线。为简便起见,我们常互换使用“直线”和“线段”这两个术语。
非垂直直线在欧几里得平面的方程为:$y = m x + b$,其中$m$是直线的斜率,$b$是$y$轴截距(即直线与$y$轴的交点)。若需要,也可使用更通用的方程$a x + b*y + c = 0$来表示垂直直线,但这里我们主要使用第一个公式。
以下是一些直线方程的示例:
| 直线方程 | 描述 |
| — | — |
| $y = 3$,$y = 0$,$y = -3$ | 三条水平直线 |
| $y = x$,$y = -x$ | 两条斜线 |
| $y = 2 x$,$y = 2 x + 3$ | 两条平行斜线 |
2. 使用NumPy和Matplotlib生成散点图
我们可以使用NumPy和Matplotlib来生成准随机数据并绘制散点图。
2.1 示例代码1:np_plot1.py
import numpy as np
import matplotlib.pyplot as plt
x = np.random.randn(15,1)
y = 2
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



