成功的数据项目:从流程到线性回归
1. 成功的流程
在项目中,即使拥有最聪明的人、最好的软件和算法,也不能保证成功。解决问题或改进决策的关键往往在于沟通和影响力等软技能。为了实现成功,我们可以采用 Cross-Industry Standard Process for Data Mining (CRISP-DM) 这一灵活且全面的框架。
1.1 CRISP-DM 流程概述
CRISP-DM 流程专为数据挖掘设计,但可应用于任何分析项目,如预测分析、数据科学或机器学习。该流程包含六个阶段:
1. 业务理解
2. 数据理解
3. 数据准备
4. 建模
5. 评估
6. 部署
1.2 业务理解
这是整个流程的基础步骤,其目的是确定业务需求并将其转化为分析目标。具体包含以下四个任务:
- 确定业务目标 :关键在于明确组织的目标并界定问题。可以问“我们将做出哪些不同的决策?”以此确定决策点。同时,要管理好预期,因为不存在完美的数据。此任务建议输出使命声明,包括谁(团队或项目名称)、做什么(任务,如机器学习)、何时(截止日期)、何地(地理、职能等范围)、为什么(业务目标)。另外,要尽可能清晰地定义成功标准。
- 评估情况 :收集可用资源、约束和假设的信息,识别风险并制定应急计划。同时,确定受决策影响的关键利益相关者,并与项目发起人制定沟通计划。
- 确定分析目标 :将业务目标转化为技术要求,例如将成功标准转化为 RMSE 或预测准确性等技术指标
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



