现实世界中的机器学习:从基础到实践
1. 机器学习简介
1.1 机器学习的兴起与需求
近年来,机器学习已成为一项热门业务。企业利用它来盈利,工业和学术领域的应用研究也呈爆炸式增长,各地好奇的开发者都希望提升自己的机器学习技能。然而,目前对于如何在实际场景中运用这些技术的优质学习方法却供不应求。
1.2 机器学习的本质
应用机器学习既包含数学原理,也需要一些实用技巧,是一门真正的技艺。过于专注某一方面而忽视另一方面都会导致失败,因此保持平衡至关重要。
过去,学习机器学习的最佳(也是唯一)途径是在相关领域攻读高级学位,专注于核心算法及其理论特性和边界,以及该领域的典型问题。与此同时,一些宝贵的经验通过非官方渠道积累和传承,比如会议走廊、研究实验室的内部知识,以及同事之间传递的数据处理脚本。这些经验才是实际工作得以完成的关键,它们能确定在每种情况下最适合的算法、如何处理数据的每个步骤,以及如何将管道的不同部分连接起来。
如今,我们处于开源资源丰富的时代,大多数机器学习算法的高质量实现都能在 GitHub 上轻松获取,还有全面且架构良好的框架将所有部分整合在一起。但即便如此,那些非官方的经验仍然难以获取。
1.3 机器学习方法的现状与挑战
目前广泛使用的机器学习方法远非完美。这些方法对输入数据很挑剔,如果不加以谨慎处理,它们往往会给出过于自信的预测。输入数据的微小变化可能会导致模型产生巨大且难以解释的变化,其结果也难以解释和进一步探究。现代机器学习工程可以看作是对这些潜在问题的管理和缓解。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



