概述
机器学习,顾名思义,就是学习得像机器一样,形成一种解决某类问题的模型,以便我们遇到问题解决问题。下面我将介绍机器学习的框架和一些常用的比较主流的算法。
框架
确定目标
- 业务需求:首先我们必须要明确机器学习是要用来解决问题的,一般是通过大量的数据,来预测未来的行为。所以首先要明确的就是业务需求,明确了业务需求,才能采集对应的数据,进行深入研究。
- 数据:这个数据就是我们要分析的基础,但不是机器学习的直接原材料,所有的数据都在数据池中,而且这个数量是庞大的,也是根据上一步明确了业务需求之后进行的。
- 特征工程(Feature Engineering):这个步骤可以说是在明确目标这一模块中最为重要的,包括数据清洗、数据整合、特征提取等几个步骤,根据我们的业务需求,提取出具有相同特征满足我们想要结果要求的所有数据。要知道数据池中的数据是杂乱无章的,参差不齐的,所以要提取出整齐的,满足我们要求的数据,是相对复杂也极为重要的,只有这一布处理好了,下面进行训练的时候才能较为准确,更加高效。
训练模型
- 定义模型:要想通过学习训练得到训练模型,必须要先定义一个模型,明确要得到一个什么样的模型,才能通过大量的数据训练得到期望的较为准确的模型。
- 定义损失函数:什么是损失函数?顾名思义,是为了填补损失的函数。何谓损失?