摘要: Canvas是用于设计和记录机器学习系统的模板。它比简单的文本文档具有优势,因为Canvas用简单的部件通过部件之间的相关性来寻找机器学习系统的关键组件。这个工具已经很流行,因为它对复杂项目进行了可视化操作。 在本文中,我们通过列举数据科学家遇到的实际问题和实用的技巧来描述Canvas的每个部分。
价值主张
机器学习应该以满足用户需求为目的进行设计
- 谁是预测系统的最终用户?
- 我们需要他们做些什么?
- 服务的目标是什么?目标的意义又是什么?
只有在回答这3W问题之后,你才能开始思考一些关于数据收集、特征工程、建模、评估和监测系统的问题。
从数据中学习
让我们继续看看专门用于从数据中学习的Canvas的流程,它是由数据源、收集数据、特征工程、建模等几部分组成的。