机器学习系统实战指南:从理论到实践
1. 机器学习系统的整体视角
在当今科技领域,机器学习(ML)和人工智能(AI)技术正以前所未有的速度重塑着计算和社会。然而,很多现实世界中的ML系统存在着可靠性问题。我们关注的并非机器学习的算法本身,而是如何让机器学习系统在实际应用中发挥作用,即采用全系统导向的方法,涵盖从数据管理到模型部署、监控等整个机器学习生命周期。
2. 写作目的与背景
当前,ML和AI技术的发展日新月异,但公众的认知与实际情况存在差距。许多组织既担心错过ML带来的机遇,又面临着技术复杂性的挑战。本书旨在帮助读者应对这些复杂性,强调通过简单化和标准化的方法,让组织更好地将ML融入业务,实现可靠的机器学习应用。
3. 以SRE视角看待ML
现有的很多机器学习书籍侧重于让ML之旅更轻松、快速或高效,但很少关注如何提高ML系统的可靠性。而通过站点可靠性工程(SRE)的视角来看待ML,能够更全面、可持续地考虑客户体验,为应对ML系统的挑战提供更好的框架。因为安全和可靠性紧密相连,ML系统的复杂行为也需要更整体的方法来进行开发、部署和运营。
4. 目标受众
本书面向多个群体:
- 数据科学家和ML工程师 :探索数据、特征和模型架构如何影响模型的运行和长期可管理性,关注模型速度。
- 软件工程师 :学习如何将ML集成到系统中,以及编写ML基础设施,理解ML生命周期有助于开发功能、设计API和支持客户。
- 站点可靠性工程师 :了解ML系统常见的故障模
超级会员免费看
订阅专栏 解锁全文
9万+

被折叠的 条评论
为什么被折叠?



