- 博客(2)
- 收藏
- 关注
原创 大数据分析与挖掘-Part2-数据预处理
大数据分析与挖掘-Part2-数据预处理为什么要进行数据预处理?初始数据集的准备与变化是数据挖掘的过程中重要步骤包含大量不完整,含噪声和不完整的数据是大数据应用中的典型特点数据的预处理能够有效提高数据质量,节约大量的时间和空间大部分数据挖掘算法对输入数据的格式,质量以及规模有一定的要求现实世界的数据是“脏的”随着数据规模的增加,会出现很多数据质量问题:不完整缺失值:缺乏某些重要属性,仅包含聚集数据噪声包含错误值,离群点不一致由于重复存放的数据未能进
2021-07-05 19:29:43
2023
原创 大数据分析与挖掘-Part1-绪论
大数据分析与挖掘-Part1-绪论大数据基本特征(4V)Volume 数据体量大Variety 数据多样性,且多为非结果型数据Value 价值密度低Velocity 速度快,实时性高,对于高速动态数据流,处理数据越即时,产生的价值越大(大)数据挖掘概念从大量数据中抽取出有价值的信息和模式的过程数据挖掘一般流程数据集选取一般数据集是已经存在的或者至少知道如何获得的(访问某个资料库,网上过滤抓取需要的数据,问卷调查手动收集等)。数据集的选取对数据挖掘模式是否有趣起决定
2021-07-04 23:51:51
233
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人