核心学习算法:线性回归及拓展
1. 核心学习算法概述
学习的本质是通过分析过去的数据,以有意义的方式预测其未来值。根据数据类型和预测目标的不同,学习算法主要分为以下几类:
- 回归 :当处理连续数据时,如股票价格或呼叫中心的通话量,这类预测被称为回归。回归旨在找到一条最佳曲线来总结数据,是一种强大且研究充分的监督学习算法。通过发现可能生成数据点的曲线,我们可以解释数据为何如此分布,并对未知数据的值进行预测。
- 分类 :若要预测特定的离散类别,如图像中的物体是狗、鸟还是猫,或者判断文本的情感是积极还是消极,这类预测被称为分类。分类不仅适用于图像,还可用于各种事物的分类。
- 聚类 :有时,我们希望从数据中发现自然模式,以便对数据进行分组。例如,将具有相关属性的数据聚类在一起,如大量音频文件中的所有咳嗽声,或者根据手机数据推测其所有者的活动类型,如行走、交谈等。
- 马尔可夫模型 :由于有些事件的直接原因难以观察,这使得预测变得具有挑战性。例如,尽管我们拥有先进的建模能力,但预测某一天是下雨、晴天还是多云的准确率仍只有 50%。这是因为实际的因果关系往往隐藏且不可直接观察。马尔可夫模型可以基于隐藏的因果关系进行结果预测,是一种出色的可解释技术,可应用于天气预测以及其他诸多领域,如自动读取大量文本并判断单词是名词还是形容词。
2. 线性回归基础
在高中的科学课程中,我们常常会用到一种分析数据的方法:绘制一个变量的变化如何影响另一个变量。例如,绘制降雨频率与农业产量之间的相关性,我们可能会发现
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



