利用 AWS 实现自动化机器学习:从入门到实践
1. 机器学习操作化的挑战
在当今的科技领域,机器学习模型的操作化是一个普遍面临的难题。训练第一个模型就可能像是一座难以逾越的大山,而当你好不容易完成训练,又会发现还需要一个端到端的管道来提供新数据进行推理,并在模型性能下降时进行重新训练。
AWS 虽然提供了广泛而深入的机器学习服务,但要确定从哪里开始以及如何将这些选项整合起来,通常需要数月的痛苦实验。不同的团队对机器学习的需求差异巨大,有些团队刚开始投资人工智能和机器学习,希望构建第一个模型;而同一组织内的其他团队则希望扩展复杂的实验和监控框架,以支持数千个生产中的模型。大多数公司会聘请数据科学家或机器学习工程师,但往往存在技能不匹配的问题。
2. 自动化机器学习的重要性
机器学习领域发展迅速,专注于单一算法、包或平台可能会导致内容过时。将连续集成(CI)和连续交付(CD)等永恒的软件工程概念应用到机器学习领域是一个很好的解决办法。
自动化机器学习(AutoML)可以帮助我们减少模型训练的时间。例如,数据科学家由于之前接触的自动化感觉更像是束缚而非加速器,常常对 AutoML 不屑一顾。而新手和经验丰富的数据科学家也可能因缺乏经验或不了解其好处而忽视 AWS 上的 AutoML。但实际上,了解何时以及为何使用 AutoML 来为新项目获取初始基准,或避免每次重新训练模型时手动选择和调整算法,可以将模型训练时间减少一个数量级。
学习如何考虑机器学习管道的长期维护也很重要,这能帮助我们避免在重构现有模型或交付新项目之间做出痛苦的决策。软件工程师已经利用 CI/CD 流程十多年了,但大多数机器学习从业者并不了解 DevOp
AWS自动化机器学习实战指南
超级会员免费看
订阅专栏 解锁全文
1896

被折叠的 条评论
为什么被折叠?



