机器学习:从基础到实践的全面指南
1. 机器学习模式概述
在处理各种问题时,我们会先描述常见问题,接着探讨多种潜在解决方案,权衡这些方案的利弊,并给出选择建议。这些解决方案的实现代码会以 SQL、scikit - learn 和/或使用 TensorFlow 后端的 Keras 形式提供。
这里的模式是在多个团队的实践中观察总结而来的,我们不宣称发明或发现了这些模式,而是希望为机器学习从业者提供一个通用的参考框架和工具集。
阅读时不一定要按顺序进行,你可以先浏览,深入阅读部分章节,在与同事交流时参考其中的想法,遇到曾读过的问题时再回头查阅。若想跳跃阅读,建议先看相关的基础内容,再深入单个模式。
每个模式都有简短的问题陈述、标准解决方案、解决方案生效的原因解释,以及关于权衡和替代方案的多方面讨论。阅读讨论部分时,要牢记标准解决方案以便进行对比。模式描述中会包含标准解决方案实现的代码片段,完整代码可在 GitHub 仓库找到,建议阅读模式描述时查看代码。
2. 机器学习术语
由于机器学习从业者的专业领域不同,如软件工程、数据分析、DevOps 或统计学等,对某些术语的使用可能存在细微差异。下面是一些常用术语的定义。
2.1 模型与框架
机器学习的核心是构建从数据中学习的模型,这与传统编程不同,传统编程需编写明确规则来告知程序如何运行。机器学习模型是从数据中学习模式的算法。
以搬家公司估算搬家成本为例,传统编程可能使用如下 if 语句:
if num
机器学习全流程实战指南
超级会员免费看
订阅专栏 解锁全文
9万+

被折叠的 条评论
为什么被折叠?



