- 博客(17)
- 收藏
- 关注
原创 数据挖掘
学习笔记二一、数据预处理1、数据质量用准确性、完整性、一致性、时效性、可信性和可解释性定义。质量基于数据的应用目的评估。2、数据预处理的主要步骤,即数据清理、数据集成、数据归约和数据变换。3、数据清理例程试图填充缺失的值、光滑噪声并识别离群点、纠正数据中的不一致。 3.1 缺失值3.1.1 忽略元组 当缺少类标记符号时通常这样做(假定挖掘任务涉及分类)。3.1.2 ...
2018-04-03 22:13:15
720
原创 数据挖掘
学习笔记一一、认识数据1、数据对象与属性类型数据集由数据对象组成。一个数据对象代表一个实体。 属性是一个数据字段,表示数据对像的一个特征。在文献中,术语“维”(dimension)一般用在数据仓库中,机器学习文献中更倾向于使用术语“特征”(feature),统计学家则更愿意使用术语“变量”(variable)。1.1 标称属性指一些符号或事物的名称因为标称属性值并不具有...
2018-03-28 20:57:11
807
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人