概念
数据分析(Data Analysis):是以数据为分析对象,以探索数据内的有用信息为主要途径,以解决业务需求为最终目标,包含业务理理解、数据采集、数据清洗、数据探索、数据可视化、数据建模、模型结果可视化、分析结果的业务应用等步骤在内的一整套分析流程。
数据挖掘(Data Mining) : 是一个跨学科的计算机科学分支,它是⽤用人工智能、机器器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程。
数据分析的八个层次
数据分析的目的:
- 发现有价值的信息;
- 提出结论;
- 为业务发展提供辅助决策。
它描述了 “过去发生了什么”、“现正在发生什么” 和 “未来可能发生什么”。
根据分析层次的级别不同,分为常规报表、即席查询、多维分析(又称钻取或OLAP)、警报、统计分析、预报(或者时间序列预测)、预测型建模(Predictive Model)和优化。
数据挖掘方法论
CRISP-DM方法论
CRISP-DM方法论将数据挖掘项目生命周期分为6个阶段,它们

本文介绍了数据分析的概念和目的,包括数据挖掘的8个层次,如常规报表、统计分析和预测建模。接着,详细阐述了两种数据挖掘方法论:CRISP-DM和SEMMA。CRISP-DM包括业务理解、数据理解、数据准备、建模、模型评估和部署六个阶段;SEMMA则增加了数据整理和样本探索步骤,强调对数据质量的深入探索和变量修改。
最低0.47元/天 解锁文章
2038

被折叠的 条评论
为什么被折叠?



