20 理解业务和数据:我们需要做好什么计划?_哔哩哔哩_bilibili
目录
一、理解业务和数据:我们需要做好什么计划?
在开始数据挖掘的时候
要确保你对业务及其数据有充分的理解
1.1两个思想问题
1.2为什么数据挖掘不是万能的
数据挖掘只能在有限的资源与条件下去提供最大化的解决方案
1.3业务背景与目标
1.4把握数据
1.5总结
二、 准备数据:如何处理出完整、干净的数据?
做好数据的准备工作是获得一个好结果的必由之路,准备数据不是独立存在的,不是说一次性做完数据准备工作就结束了。后面的模型训练和模型评估环节数据的准备相关,当模型出现错误,结果达不到预期,往往需要重新回到数据准备环节进行处理,反复迭代几次最终才能达到期望。
2.1找到数据
2.2数据探索
2.3数据清洗
2.3.1缺失值处理
2.3.2异常值的处理
2.3.3数据偏差
2.3.4数据标准化
2.3.5特征选择
2.4构建训练集和测试集