埃森哲大数据分析方法:学习笔记

本文介绍了埃森哲大数据分析的方法,重点关注数据清洗阶段的异常值判别和处理。异常值判断涉及物理判断法和统计判断法,如拉依达准则、格拉布斯准则和狄克逊准则。对于缺失值处理,文章提到了数据探索和数据转换的重要性。整个数据分析流程包括业务理解、数据理解、数据准备等步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据分析框架

第一步&业务理解

第二步&数据理解:数据收集、数据清洗

数据清洗:异常值判别

异常值判断方法有:物理判断法&统计判断法

       1、物理判断法:根据人们对客观事物、业务等已有的认识,判别由于外界干扰、人为误差等原因造成实测数据偏离正常结果,判断异常值。通常比较困难、主观性较强。

       2、统计判断法:给定一个置信概率,并确定一个置信限,凡超过此限的误差,就认为它不属于随机误差范围,将其视为异常值。常用的统计学方法<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值