机器学习概念
- http://en.wikipedia.org/wiki/Machine_learning
- 机器学习是人工智能的一个分支,主要关于构造和研究可以从数据中学习的系统
- 它是依赖于数据的,需要输入大量的数据,因为我们现在是大数据时代,让机器学习更流行
- 过去的经验,它是蕴含在历史数据中,我们要从数据中学习过去的经验,获得经验后会对类似的新样本或场景做出预测
数据
- 在机器学习中的数据通常是以二维表的形式写出来
- 二维表类似于我们关系数据库里头的数据表,每一行,表示一个样本,每一列表示一个属性/特征
案例
Boston房价预测数据,根据某地区房屋属性,预测该地区房价
- 共506行,表示有506个样本
- 共14列
- 前13列为该地区房屋的属性(CRIM、…、LSTAT)
- 最后1列为该地区房价中位数 MEDV
- 根据区域房屋属性,预测该地区房价中位数