机器学习自动化与持续改进:从理论到实践
1. 机器学习的现状与挑战
世界迫切需要高质量的机器学习模型来解决诸多重大问题,如攻克癌症、优化清洁能源、改进药物研发以及打造更安全的交通系统等。为了实现这一目标,我们应尽可能自动化当前可自动化的任务,并探索将目前无法自动化的任务实现自动化的方法。
AutoML(自动化机器学习)主要负责在干净数据上自动化训练模型的相关任务。然而,现实世界中的问题并非都如此简单,因此机器学习的各个方面都需要自动化。KaizenML 正是为填补这一空白而出现的,“Kaizen”在日语中意为持续改进,KaizenML 强调以持续改进和自动化为核心来开发机器学习系统。
许多机器学习从业者对 AutoML 看法不一。数据科学是一种行为方式,而 AutoML 只是一种技术,它们都是构建机器学习系统的一小部分,并且相互补充。AutoML 引发争议的原因在于,数据科学家担心它会取代自己的工作,但实际上,AutoML 仅占自动化和持续改进这一庞大过程的 5%,即 MLOps(机器学习运维)/ML 工程/KaizenML 的一小部分。
回顾历史,1760 - 1840 年的工业革命使人类任务大量转向由蒸汽和煤炭机器驱动的自动化任务,推动了人口增长、GDP 提升和生活质量改善。大约在 1870 年,第二次工业革命带来了大规模生产和新的电网系统。以特斯拉工厂为例,机器人承担了大部分汽车制造工作,人类则辅助机器人完成它们尚未完全自动化的任务。同样,传统数据科学工作流程中,人类手动调整超参数的方式就像第二次工业革命早期的福特装配厂,随着发展,这些手动任务终将被自动化,且最先自动化的往往是最容易的部分。
在机器学习和人工智能领域,技术可能会逐渐商
超级会员免费看
订阅专栏 解锁全文
5946

被折叠的 条评论
为什么被折叠?



