数据分析的一般流程介绍
数据分析的真正价值在于发现问题,解决问题,创造价值。使用什么软件、工具并不是重要。现在市面上的出现的好多机构,解决的更多的是入门使用工具的问题,演变成手段问题。
数据分析是把现实的问题转化为数据能够解决的问题,使用我们学习到的知识和经验,将数据提炼出来的信息应用,创造价值的过程。
分为三部:
从问题到数据,数据到信息,信息到行动。
- 问题到数据:[5-15%]
- 准确定义实际问题
- 评估当前状况
- 确定数据挖掘的目标
- 制定项目计划
- 数据到信息
数据准备[10-15%]- 收集数据
- 描述数据
- 初步探索变量关系
数据处理[45-55%] - 数据处理
- 数据变换
- 变量选择
建模 [5-15%]
模型评估[5-10%]
- 模型应用[10-15%]
- 结果交流展示
- 行动计划
- 模型监测维护
- 项目评估反馈
从问题到数据
(准确定义实际问题,评估当前状况,确定数据挖掘目标,制定项目计划)
谁是你的客户? 你知道你的客户嘛,你要怎么与他们交流?
你能把问题具体化嘛?
理解你的客户的问题
问题1:如何提高产品销售量?
问题2:今年年初推出的新促销