1.1 统计学习
1.统计学习的特点
- 以数据为研究对象,数据驱动
- 以计算机及网络为平台,建立在计算机及网络之上
- 以方法为中心,构建模型
- 以对数据进行预测与分析为目的
总之,基于数据构建模型,运用模型对数据进行预测与分析
2.统计学习的对象-数据
- 从数据出发,提取数据特征,抽象出数据的模型,对数据进行分析与预测
- 数据来源多样,包括平台上的数字,文字,图像,音视频等等
- 同类数据具有一定的统计规律性,可以用概率统计方法来处理,是统计学习的前提
- 同类数据指具有某种共同性质,如英文文章/互联网网页/数据库中的数据
- 数据以变量或变量组表示,分为连续和离散变量
3.统计学习的目的-对数据进行预测与分析
- 数据的预测可以使计算机更加智能化,提高性能
- 数据的分析可以让人们获取新的知识,带来新的发现
- 通过构建概率统计模型实现
- 考虑学习什么样的模型和如何学习模型,从而更高准确高效
4.统计学习的方法-构建数据模型
- 由监督学习/非监督学习/半监督学习/强化学习等组成