机器学习应用:从线性回归到分类问题
1. 机器学习概述
机器学习是人工智能领域的一部分,主要研究如何编写计算机程序以智能地完成任务。一个算法若要被归类为机器学习算法,它不仅要能自主且智能地运行,还必须能从经验中学习,即接收的数据越多,在当前任务中的表现就越好。
接下来我们重点关注一种特定的机器学习类型——监督学习。在编写监督学习算法时,我们会给算法提供包含输入和对应输出的训练数据集,算法应能据此对新的输入数据自行得出正确的输出。从某种意义上说,训练机器学习算法的结果是得到一个新的数学函数,该函数能有效地将某种输入数据映射为某种决策输出。
1.1 线性回归预测二手车价格
线性回归是一种简单的监督学习算法,可用于根据二手车的里程数预测其价格。以一个包含 740 辆在 CarGraph.com 网站上出售的丰田普锐斯二手车的数据集为例,该数据集记录了每辆车的里程数和售价。通过绘制散点图,我们可以发现随着里程数的增加,价格呈现下降趋势,这反映了汽车在行驶过程中会贬值。
我们的目标是找到一个简单的函数来描述二手普锐斯的价格随里程数的变化。这里我们从最简单的线性函数开始,其形式为 (p(x) = ax + b),其中 (x) 是汽车的里程数,(p) 是价格,(a) 和 (b) 是决定函数形状的参数。例如,当 (a = -0.05) 且 (b = 20000) 时,该函数意味着一辆新的普锐斯价值 20000 美元,并且每行驶一英里贬值 0.05 美元。但这个函数可能并不准确,因为其图像与大部分数据点并不接近。
寻找 (a) 和 (b) 的值,使 (p(x)) 尽可能地符合数据趋势的任务被称为线性回归。一旦找到最佳值,我们就可以说
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



