2、成功的数据项目:从流程到线性回归

成功的数据项目:从流程到线性回归

1. 成功的流程

在项目中,即使拥有最聪明的人、最好的软件和算法,也不能保证成功。解决问题或改进决策的关键往往在于沟通和影响力等软技能。为了实现成功,我们可以采用 Cross-Industry Standard Process for Data Mining (CRISP-DM) 这一灵活且全面的框架。

1.1 CRISP-DM 流程概述

CRISP-DM 流程专为数据挖掘设计,但可应用于任何分析项目,如预测分析、数据科学或机器学习。该流程包含六个阶段:
1. 业务理解
2. 数据理解
3. 数据准备
4. 建模
5. 评估
6. 部署

1.2 业务理解

这是整个流程的基础步骤,其目的是确定业务需求并将其转化为分析目标。具体包含以下四个任务:
- 确定业务目标 :关键在于明确组织的目标并界定问题。可以问“我们将做出哪些不同的决策?”以此确定决策点。同时,要管理好预期,因为不存在完美的数据。此任务建议输出使命声明,包括谁(团队或项目名称)、做什么(任务,如机器学习)、何时(截止日期)、何地(地理、职能等范围)、为什么(业务目标)。另外,要尽可能清晰地定义成功标准。
- 评估情况 :收集可用资源、约束和假设的信息,识别风险并制定应急计划。同时,确定受决策影响的关键利益相关者,并与项目发起人制定沟通计划。
- 确定分析目标 :将业务目标转化为技术要求,例如将成功标准转化为 RMSE 或预测准确性等技术指标

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值