数据预处理的主要内容包括数据清洗、数据集成、数据变换和数据规约。 1 数据清洗 数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值。 点击此处下载文档和源码