机器学习分类
- 模式识别
- 计算机视觉
无人驾驶汽车 ,判断前方有没有车 - 数据挖掘
挖取有用的信息,比如游戏公司可以挖掘哪些用户会退坑 - 语音识别
- 统计学习
- 自然语言处理
机器学习的具体干什么
举个例子,现在我想看个新闻,但是我想先知道这个新闻是体育类的还是非体育类的。就可以写个算法,让计算机去识别。
但在识别前需要给计算机提供足够的训练样本来告诉它什么才是体育类新闻,什么不是。在训练的途中需要一个人工的阶段,就是通过人对体育新闻和非体育新闻的理解来提取特征信息并告诉计算机,这一步至关重要。高端职业数据科学家就是从事这样的工作,他们强的地方不在于写代码,而是能在海量数据中发现特征信息。当特征抽取出来后,就要思考如何把这个信息告诉计算机,因为计算机只认识0和1,而人脑非常高级,所以最终要把文字信息转变为数字信息传达给计算机去学习,这就需要学习函数f(x)。具体来说,就是讲大量的数据样本以点的方式投影到一个坐标系上,并在体育类和非体育类中寻找一条划分曲线,并求得这个曲线的函数,这个函数就是学习函数f(x)。如图:
完成后就是测试,用我们写好的算法对新的样本进行预测。
机器学习相关知识
- Numpy:科学计算库
里面封装了许多科学计算的库,如矩阵。 - Pandas : 数据分析库处理
如缺失值怎么处理等操作的库 - Matplotlib:数据可视化库
进行画图操作,来帮助我们可视化数据 - Scikit-learn:机器学习库
里面封装了许多机器学习的算法