立即学习:https://edu.youkuaiyun.com/course/play/26990/361135?utm_source=blogtoedu
异常值的处理:
- 指那些偏离正常范围的值,不是错误值
- 异常值出现频率较低,但又会对实际项目分析造成偏差
- 异常值一般用过箱线图法(分位差法)或者分布图(标准差法)来判断
- 异常值往往采取盖帽法或者数据离散化
一些细节:
分位差 = 上四分位数 - 下四分位数
上界 = 上四分位数 + 1.5 * 分位差
下界 = 下四分位数 - 1.5 * 分位差
异常值处理技巧
了解异常值的概念及其对项目分析的影响,掌握使用箱线图法和分布图判断异常值的方法,学习异常值处理策略如盖帽法和数据离散化。
3554

被折叠的 条评论
为什么被折叠?



