数据科学中的机器学习:从数据分析到无监督学习
一、数据分析生命周期与团队角色
1.1 数据分析生命周期框架
市场上有多种数据分析生命周期框架,它们基本结构相似但存在细微差异。遵循这些阶段和活动,能减少机器学习项目实施中的常见问题。不过,要注意各阶段之间的迭代性,前一阶段基础不扎实,会影响后续阶段。例如,数据发现和预处理阶段至关重要,据调查,数据科学家超 80% 的时间用于数据采集、清理和组织,仅不到 20% 的时间用于创建和优化机器学习模型,且超 75% 的人认为数据准备是最不喜欢的环节。
| 项目活动 | 项目时间分配百分比 |
|---|---|
| 收集数据 | 19% |
| 构建训练数据集 | 3% |
| 清理、丰富和组织数据 | 60% |
| 挖掘数据模式 | 9% |
| 优化算法 | 5% |
| 其他活动 | 4% |
1.2 团队成员角色与职责
一个成功的项目涉及多个角色,各角色职责明确:
| 关键项目角色 | 描述 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



