第一章 机器学习基础
- 机器学习就是把无序的数据转换为有用的信息
- 机器学习关键术语:专家系统;特征;实例;分类(机器学习的主要任务);训练集;训练样本;目标变量;类别
- 机器学习的主要任务:分类、回归、聚类和密度估计。
常见机器学习算法
监督学习算法 | 无监督学习算法 |
---|---|
k-近邻算法 | K-均值 |
线性回归 | 最大期望算法 |
朴素贝叶斯算法 | DBSCAN |
局部加权线性回归 | Parzen窗设计 |
支持向量机 | |
Ridge回归 | |
决策树 | |
Lasso最小回归系数估计 |
如何选择合适算法?
- 考虑目的
- 考虑数据
开发机器学习应用程序的步骤
- 1.收集数据
- 2.准备输入输出
- 3.分析输入数据
- 4.训练算法(监督学习而言)
- 5.测试算法
- 6使用算法
NumPy函数库基础
- NumPy矩阵(matrix)和数组(array)的区别:
http://blog.youkuaiyun.com/vincentlipan/article/details/20717163 - matrix是个class:mat()把数组转换为矩阵,mat.I求逆运算(inverse),eye(n)创建n×n的单位矩阵。