数据拟合与分类:线性、非线性及逻辑回归的应用
1. 线性回归拟合数据
线性回归是一种常见的数据分析方法,其目标是找到一条最佳拟合线,使成本函数最小化。通过这种方式,算法能够“学习”根据普锐斯汽车的里程数来评估其价值。计算线性回归以获得最佳拟合线的方法有很多种,包括使用一些优化的 Python 库。无论采用何种方法,最终都应得到使平方误差之和最小的线性函数。
1.1 梯度下降法求最佳拟合线性函数
以测试数据为例,使用梯度下降法找到最佳拟合的线性函数。具体步骤如下:
1. 编写一个函数,计算 $f(x) = ax + b$ 相对于测试数据的成本,该成本基于系数 $a$ 和 $b$:
def test_data_linear_cost(a,b):
def f(x):
return a*x+b
return sum_squared_error(f,test_data)
- 由于预期 $a$ 和 $b$ 分别接近 2 和 0,可绘制围绕这些点的热图,以了解要最小化的函数:
scalar_field_heatmap(test_data_linear_cost,-0,4,-2,2)
- 使用梯度下降法最小化该函数,得到 $a$ 和 $b$ 的精确值:
超级会员免费看
订阅专栏 解锁全文
751

被折叠的 条评论
为什么被折叠?



