数据挖掘的过程可以分成以下 6 个步骤。
商业理解:数据挖掘不是我们的目的,我们的目的是更好地帮助业务决策;所以的从实际商业需求出发,在这个基础上,再对数据挖掘的目标进行定义。
数据理解:尝试收集部分数据,然后对数据进行探索,包括数据描述、数据质量验证等。这有助于你对收集的数据有个初步的认知。
数据准备:开始收集数据,并对数据进行清洗、数据集成等操作
模型建立:选择和应用各种数据挖掘模型,并进行优化,以便得到更好的分类结果。
模型评估:对模型进行评价,并检查构建模型的每个步骤,确认模型是否实现了预定的商业目标。
上线发布:模型的作用是从数据中找到金矿,也就是我们所说的“知识”;数据挖掘结果如果是日常运营的一部分,那么后续的监控和维护就会变得重要。
《利用Python进行数据分析》(使用Python的人可以看看)
《Pentaho Kettle解决方案》(ETL工程师会用到)
《精益数据分析》(商业模式画布,如何构建数据指标体系)
《Tableau数据可视化实战》
《看穿一切数字的统计学》
《写给所有人的极简统计学》
绘图工具:幕布类似与石墨文档,在其基础上增加了一键生成思维导图
xmind需要下载,功能上和process on类似,不过process on有在线版,不需要下载;
有道云笔记,博客等都可以记录笔记进行分享