数分析基础知识
从广义的角度,数据分析分为三个方面体包括** ‘数据分析’,‘数据挖掘’,‘模型算法’**。
数据分析:偏重于数理统计,用统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论。
数据挖掘:指从大量的数据中通过算法搜索隐藏于其中信息的过程,一般这个过程是计算机来实现。最经典且流传已久的数据挖掘成功案例:"尿布与啤酒"的故事。
数据分析使用环境
数据分析在具体业务中的使用环境:
①业务逻辑清晰,指标明确。
例如:我要分析某网店营销情况,指标:销售额= 人均金额 X 人数,消费人数 = 浏览过的人数X 留存率
浏览记录人 = 平台面向的人群数X 进店比率
②可以转为恰当的数据,数学,统计问题。
③有足够的数据支撑。
④熟悉模型,分析方法的局限性:每个模型都有其局限性。
⑤从场景中来,到场景中去。
数据分析目的
挖掘规律,验证猜想,进行预测
#数据获取途径
-
公开信息:上市公司年报,统计局信息,外部数据库;
-
非公开信息公司自有数据库,调查问卷,客户数据
数据清洗
保证数据可读性,数据完成性,数据唯一性,数据唯一性,数据合法性
#数据