核心学习算法:线性回归及拓展
1. 核心学习算法概述
学习的本质在于分析过往数据,并以有意义的方式预测其未来值。根据数据类型和预测目标的不同,学习算法可分为以下几类:
- 回归 :当数据是连续的,如股票价格或呼叫中心的通话量,这种预测被称为回归。
- 分类 :若要预测特定的离散类别,如图像中的物体是狗、鸟还是猫,或者判断文本的情感是积极还是消极,这类预测则属于分类。
- 聚类 :有时,我们希望从数据中发现自然模式,以便对数据进行分组,例如将具有相关属性的数据聚类在一起,像从大量音频文件中找出所有咳嗽声,或者通过手机数据推测其所有者的活动类型,如行走、交谈等。
- 马尔可夫模型 :有些情况下,我们无法直接观察到事件的原因,这使得预测变得困难。例如天气,尽管我们拥有先进的建模能力,但预测某一天是下雨、晴天还是多云,准确率也只有 50%。因为有时观察到的结果(雨、阳光或云)背后的真正因果关系是隐藏的,无法直接观察到。能够基于隐藏因果关系进行结果预测的模型被称为马尔可夫模型,它是一种出色的可解释技术,可应用于天气预测以及其他诸多领域,如自动读取大量书籍文本并判断单词是名词还是形容词。
2. 线性回归基础
在高中的科学课程中,我们常通过绘制一个变量的变化如何影响另一个变量来分析数据。例如,绘制降雨频率与农业产量之间的相关性,可能会发现降雨量增加会导致农业产量提高。通过拟合一条直线到这些数据点上,我们可以预测不同降雨条件下的农业产量。如果能从几个数据点中发现潜在的函数,那么这个学习到的函数就能帮助我
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



