深度学习:概念、发展与实践入门
1. 深度学习概述
深度学习让解决问题变得更加容易,因为它将机器学习工作流程中曾经最关键的步骤——特征工程完全自动化。以往的机器学习技术(浅层学习)通常只是将输入数据转换到一两个连续的表示空间,一般通过简单的转换,如高维非线性投影(支持向量机)或决策树。但复杂问题所需的精细表示通常无法通过这些技术实现。因此,人们不得不花费大量精力让初始输入数据更适合这些方法处理,即手动为数据设计良好的表示层,这就是特征工程。
而深度学习则完全自动化了这一步骤,只需一次学习就能获取所有特征,无需手动设计。这极大简化了机器学习工作流程,常以简单的端到端深度学习模型取代复杂的多阶段管道。
深度学习学习数据有两个重要特征:
- 逐步、逐层地发展出越来越复杂的表示。
- 这些中间的增量表示是联合学习的,每一层都会根据上一层和下一层的表示需求进行更新。这两个特性使深度学习比以往的机器学习方法更加成功。
2. 现代机器学习格局
要了解当前机器学习算法和工具的格局,查看Kaggle上的机器学习竞赛是个好方法。2016 - 2017年,Kaggle主要由两种方法主导:梯度提升机和深度学习。具体而言,梯度提升用于处理有结构化数据的问题,而深度学习用于感知问题,如图像分类。梯度提升的实践者几乎都使用出色的XGBoost库,它支持数据科学中最流行的两种语言:Python和R。同时,大多数使用深度学习的Kaggle参赛者使用Keras库,因其易于使用、灵活且支持Python。
以下是这两种技术的总结表格:
| 技术类型 | 适用问题 | 常用库 |
| ---- | ---- | ---- |
超级会员免费看
订阅专栏 解锁全文
36万+

被折叠的 条评论
为什么被折叠?



