ML系统的工作优先级、人员技能需求与伦理考量
1. 工作优先级排序
在工作中,我们可以对后续工作项按优先级排序,例如从P0到P3。这样能优先处理P0级别的工作,依次类推。还可以设定规则,如果在一段时间后P0项仍未完成,就进行审查,找出阻碍因素并思考加速执行的方法。
产品团队在制定、维护和开发服务水平目标(SLOs)方面也起着重要作用。SLOs应满足客户需求,让客户满意。若不能满足,就需要进行调整。通常,产品管理团队负责这些目标的定义和发展。
2. 生产工程师与ML工程和建模的关系
2.1 不同规模组织的情况
- 小型组织 :模型开发者、系统开发者和生产工程师通常为同一人或同一小团队。就像服务开发者要负责服务的生产部署、可靠性和事件响应一样,在这种情况下,熟悉模型是工作的必要要求。
- 大型组织 :生产工程师不一定需要是模型开发者。大多数在大型企业从事ML系统生产工程的站点可靠性工程师(SREs)很少或从不自己训练模型,因为这并非他们的专业领域,也不是做好工作的必要技能。
2.2 ML生产工程师所需技能
ML SREs或ML生产工程师需要具备一些与ML相关的技能和知识:
- 对ML模型的基本了解,包括其构建方式。
- 更重要的是,要熟悉构建模型的相互关联系统的特点和结构,组件之间的关系以及数据在系统中的流动,这比学习算法的细节更关键。
例如,对于一个使用TensorFlow在特定时间读取特定特征存储或存储桶中的所有数据并生成保存模型的
超级会员免费看
订阅专栏 解锁全文
259

被折叠的 条评论
为什么被折叠?



