机器学习基础
基础知识
-
机器学习是什么
- 把无序的数据转换成有用的信息。
-
机器学习的意义
- 我们利用计算机来彰显数据背后的真实含义。
-
机器学习的任务
- 机器学习的主要任务就是分类
分类
机器学习主要分两类:
监督学习和无监督学习
监督学习
- 分类和回归都属于监督学习,之所以称之为监督学习,是因为这类算法必须知道要预测什么,即目标变量的分类信息。
- 样本集:训练数据 + 测试数据
无监督学习
无监督学习数据没有类信息,也不会给定目标值。在无监督学习中,将数据集合分成由类似的对象组成的多个类的过程称为聚类;将寻找描述数据统计值的过程称之为密度估计。
无监督学习还可以减少数据特征的维度,以便我们可以使用二维或三维图形更加直观地展示展示数据信息。
算法选择
主要考虑两个问题
- 使用算法的目的,即要完成的任务是什么。
- 若要预测目标变量的值
- 需要分析或收集的数据是什么。
Python相关的库
- 科学函数库:SciPy、NumPy(底层语言:C和Fortran)
- 绘图工具库:Matplotlib
我的博客 http://blog.geekidentity.com