第一章 Python 数据分析概述
认识数据分析
掌握数据分析的概念
数据分析是指用适当地分析方法对收集来的大量数据进行分析,提取有用信息和形成结论,对数据加以详细研究和概括总结的过程。
广义的数据分析包括 狭义数据分析 和 数据挖掘。
狭义的数据分析是指根据分析目的,采用对比分析、分组分析、交叉分析和回归分析等分析方法,对收集的数据进行处理与分析,提取有价值的信息,发挥数据的作用,得到一个有特征统计量结果的过程。
数据挖掘则是从大量的、不完全的、有噪音的、模糊的、随机的实际应用数据中,通过应用聚类模型、分类模型、回归和关联规则等技术,挖掘潜在价值的过程。
广义数据分析是指依据一定的目标,通过统计分析、聚类、分类等方法发现大量数据中目标隐含信息的过程。
掌握数据分析的流程
需求分析:数据分析中需求分析的主要内容是,根据 业务、生产和财务 等部门的需求,结合现有的数据情况,提出数据分析需求的整体分析方向、分析内容,最终和需求方达成一致意见。
数据获取:是数据分析工作的基础,是指根据需求分析的结果提取、收集数据。
数据获取有