机器学习为什么需要训练,训练出来的模型具体又是什么?

分享一个我的公众号,最近突然想玩公众号,之前做过一段时间前端开发,考虑到现在应用程序越来越多,未来社会一定是一个充满“只有你想不到,没有你做不到”的App的世界!而微信小程序又给我们这群喜爱开发的童鞋们提供了友好的入门机会,因此,不如就在当下,开始一步一步的学习并开发自己的小程序吧。这是我的公众号:目的是和大家讨论小程序开发,同时也带着开发小白入门设计开发微信小程序,来吧,加入!

正文:

解释一:
机器学习中大概有如下步骤:
确定模型----训练模型----使用模型。
模型简单说可以理解为函数。
确定模型是说自己认为这些数据的特征符合哪个函数。
训练模型就是用已有的数据,通过一些方法(最优化或者其他方法)确定函数的参数,参数确定后的函数就是训练的结果,使用模型就是把新的数据代入函数求值。
 
解释二:
你可以把机器想象成一个小孩子,你带小孩去公园。公园里有很多人在遛狗。

简单起见,咱们先考虑二元分类问题。你告诉小孩这个动物是狗,那个也是狗。但突然一只猫跑过来,你告诉他,这个不是狗。久而久之,小孩就会产生认知模式。这个学习过程,
就叫“训练”。所形成的认知模式,就是”模型“。

训练之后。这时,再跑过来一个动物时,你问小孩,这个是狗吧?他会回答,是/否。这个就叫,预测

一个模型中,有很多参数。有些参数,可以通过训练获得,比如logistic模型中的权重。但有些参数,通过训练无法获得,被称为”超参数“,比如学习率等。这需要靠经验,过着grid search的方法去寻找。

上面这个例子,是有人告诉小孩,样本的正确分类,这叫有督管学习

还有无督管学习,比如小孩自发性对动物的相似性进行辨识和分类。


链接:https://www.zhihu.com/question/29271217/answer/83272460
 
解释三:
假设现在我们要开发一个识别鸟类的计算机程序。我们已经收集了很多鸟类样本数据,比如下面这样:
这个识别鸟类的程序要完成的功能:输入一只鸟的“体重”、“翼展”、“有/无脚蹼”、“后背颜色”,输出这只鸟的种类。

换句话说,这是一个分类系统。

怎么让计算机帮助我们对鸟类进行分类?这就需要使用机器学习的方法。机器学习可以让计算机从已有的数据(上面收集的已经有分类信息的鸟类样本数据)中学习出新的知识(如何对鸟进行分类)。

那么什么是训练?在这个例子里,训练指的就是利用收集的鸟类样本数据让计算机学习如何对鸟类进行分类这一过程。

已有类别信息的鸟类样本数据集合,称为训练数据集、训练集。训练的目的是让计算机程序知道“如何进行分类”。

至于“训练的是什么”、“参数是什么”,这依赖于我们所选取的“模型”。训练的结果简单来说就是得到一组模型的参数,最后使用采用这些参数的模型来完成我们的分类任务。


再举一个简单例子说明“模型”和“模型的参数”。
假设现在我们收集了一些二维平面上的点:红色的点记为A类,绿色的点记为B类,这些点的坐标和类别信息都是已知的。现在任务是,给出一个新的点的坐标,判断它是A类还是B类。

简单观察一下数据,好像我们可以用一条平行于 y 轴的直线把 A 类点和 B 类点分开。大概是这个样子:
我们希望找到这样一条直线 x = k,直线左边绝大多数点都是 A 类,直线右边绝大多数点都是 B 类。

于是我们的分类器模型就是 x = k 这样的直线,k 就是我们的模型参数。

训练的过程就是利用已有的数据点确定参数 k 的过程。假设我们的训练结果是 k = k_0 ,那么我们就可以用 x = k_0 这条直线作为分类器对新的点进行分类了。

当然实际应用中的模型可能要复杂的多,模型参数也不会只有一个 k 这么简单。


链接:https://www.zhihu.com/question/29271217/answer/44134218

 
 
机器学习项目中,特征向量是将数据映射到数学空间中的点的过程,这个概念对于模型训练至关重要。特征向量通常包含了数据的重要信息,是数据在高维空间中的表示形式。理解特征向量的作用,以及它在模型训练中的重要性,对于构建有效的机器学习模型至关重要。 参考资源链接:[一份简明《机器学习数学基础》丝滑入门手册(来自UC伯克利),47页pdf.pdf](https://wenku.youkuaiyun.com/doc/645f33fd5928463033a7b7a3?spm=1055.2569.3001.10343) 首先,特征向量通过将原始数据转换为机器学习模型可以处理的数值形式,使得模型能够利用这些数据进行学习。在不同的机器学习任务中,如分类、回归、聚类等,特征向量用于表示样本的不同属性,这些属性可以是数值型的也可以是类别型的。 其次,在模型训练中,特征向量是影响模型性能的关键因素。它们的质量直接关系到模型学习的准确性和泛化能力。如果特征选择得当,模型能够更快地收敛并提高预测精度;反之,如果特征选择不当或缺乏相关性,模型可能会过拟合或者欠拟合,影响最终的预测效果。 在数学层面,特征向量通常与矩阵运算紧密相关。例如,在线性回归中,我们通过最小二乘法求解参数,这涉及到向量空间中的点积运算。而在更高阶的模型中,如支持向量机(SVM),特征向量在高维空间中的分布和边界划分也至关重要。 为了深入理解特征向量在机器学习中的作用,强烈建议阅读这份《一份简明《机器学习数学基础》丝滑入门手册(来自UC伯克利),47页pdf.pdf》。这份手册虽然篇幅不长,但内容覆盖了机器学习所需的数学基础,包括线性代数、概率论、统计学以及优化理论等关键部分。通过学习这些数学知识,你将能更好地理解特征向量在机器学习模型中的重要性和应用方法。 参考资源链接:[一份简明《机器学习数学基础》丝滑入门手册(来自UC伯克利),47页pdf.pdf](https://wenku.youkuaiyun.com/doc/645f33fd5928463033a7b7a3?spm=1055.2569.3001.10343)
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值