1.数据分析概述
2.数据分析流程
3.数据预处理方法
4.数据分析模型与方法
5.数据可视化
6.数据分析案例
1.数据分析概述
数据分析:对大量有序或无序的数据进行信息的集中整合、运算提取、展示等操作,通过这些操作找出研究对象的内在规律。
目的:揭示事物运动、变化、发展的规律。
意义:提高系统运行效率、优化系统作业流程、预测未来发展趋势。
2.数据分析流程
提出问题 ——> 数据采集 ——> 数据预处理 ——> 数据建模与分析 ——> 数据可视化 ——> 数据报告
3.数据预处理方法
数据预处理方法主要有:数据清洗,数据集成,数据规约和数据变换。
- 数据清洗:是通过填补缺失值、光滑噪声数据,平滑或删除离群点,纠正数据的不一致来达到清洗的目的。
- 数据集成:多个数据源集成。
- 数据规约