机器学习模型基础介绍
在机器学习领域,管理系统和生产级机器学习管道的工作与数据科学家和研究人员开发新预测模型的工作有所不同。我们的重点是确保包含机器学习模型的系统表现出一致、健壮和可靠的系统级行为。本文将快速介绍机器学习模型是什么、如何工作,以及ML Ops人员应关注的关键问题。
1. 什么是模型
在数学或科学中,模型是一种规则或准则,通常可以用数学或代码表示,用于根据输入对未来世界的运行方式进行预测。例如著名的质能公式 $E=mc^2$,它能根据给定的质量 $m$ 预测出转化后的能量 $E$。
机器学习中的模型在某些方面与之类似,它们根据输入给出输出,这些输出常被视为预测。预测内容可以是物理世界的现象(如西雅图明天的降雨概率)、数量(如在线商店下个月的纱线销量)或抽象的人类概念(如图像是否美观)。
但机器学习模型与 $E=mc^2$ 不同,很多情况下我们无法写出像它那样简洁的规则。当需要考虑众多复杂信息(即特征)时,人类专家难以创建和验证能充分利用所有可用信息的可靠模型。这时,我们会使用大量历史数据来训练模型,希望模型既能很好地拟合过去的数据,又能对未来的新数据做出准确预测。
2. 基本模型创建工作流程
目前最广泛使用的创建机器学习模型的方法是监督式机器学习,其基本流程如下:
1. 收集历史数据 :收集与问题相关的大量历史数据,如过去十年太平洋西北地区的大气传感器读数、五十万张图像或用户浏览在线纱线商店的历史记录。
2. 提取特征 :从数据中提取一组特征,即数据的特定可测量属性。对于数值数据,可能需要将值缩放到合适的范围
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



