上篇即第一篇文章简短的介绍了机器学习,让读者大致了解了机器学习是干啥的:
先来看看机器学习具体解决一些什么问题,从功能的角度出发,机器学习主要可以具体解决以下两个问题:
1、分类与预测问题
分类与预测问题是预测问题的两种主要类型,分类主要是预测分类标号(离散属性),通过构造一个分类模型,输入样本的属性值,输出对应的类别,将每个样本映射到原先定义好的类别。而预测主要是建立连续值函数模型,预测给定自变量对应的因变量的值。
应用实例:手写数字的识别(分类)、垃圾邮件的识别(分类)、电影票房的预测(回归分析)、未来房价的预测(回归分析)
2、聚类问题
分类问题是已知结果对数据特征进行分类,属于“监督学习”,而聚类则不需要知道样本所属标签,即没有给定划分类别的情况下,根据数据之间的相似度对数据进行划分,属于“非监督学习”。如常见的k-means聚类算法,通过样本之间的距离将数据分为k类。
应用实例:卖家对消费客户进行划分,新闻分类等。
数学知识基础
机器学习离不开算法,算法的根本就是一大堆数学公式,代码知识用来实现这些公式的工具,所以学习机器学习的第一步就是要有一定的数学基础。机器学习中主要运用的数学知识为:微积分、线性代数、概率与统计。比如算法中经常运用的梯度下降法与牛顿法就是微分知识的运用,本质是“梯度下降法使用平面去逼近局部