数据分析缺失值与异常值常见处理方法 在数据分析中常常会遇到数据残缺不全或异常的情况,下面介绍几种常见的处理方法 丢弃 这种效率最高,操作最简单,但是丢弃数据会损失部分信息。主要适用于,丢弃缺失大量数据的行或列,或者丢弃大量数据项中极少的数据缺失项 补全 顾名思义即使用科学的方法补全数据,这种方法对后续的建模大有好处 统计法 使用均值,加权均值,众数等统计量进行补全模型法 基于现有数据使用神经网络等算法预测缺失值 真值转换法 当缺失值或异常值为属性时,把缺失值或异常值当做一种属性值。