
数据分析
文章平均质量分 77
FrancisRZ
精于一,而悟王道。
展开
-
【数据挖掘导论】——绪论
数据挖掘导论读书笔记之绪论数据挖掘的前提:数据收集和数据存储技术的快速进步。数据挖掘是一种技术,它将传统的数据分析方法与处理大量数据的复杂算法相结合。为探查和分析新的数据类型以及用新方法分析就有数据类型提供了令人振奋的机会。数据挖掘是在大型数据存储库中,自动的发现有用信息的过程。数据挖掘与知识发现数据挖掘是数据库中知识发现不可缺少的一部分(knowled原创 2014-07-20 16:37:33 · 1673 阅读 · 0 评论 -
【数据挖掘导论】——数据类型
数据类型数据集的不同表现在很多方面。例如:描述数据对象的属性可有具有不同的类型——定量的或者定性的。并且数据集可能还具有特定的性质,如包含时间序列或者彼此相关联。这因为如此,数据的类型决定我们应使用何种工具和技术来分析数据。此外,数据挖掘的研究也是为了适应新的应用领域和新的数据类型。数据的质量数据通常远非完美,尽管大部分的数据挖掘技术都容忍不完美的数据,但注重理解和提高原创 2014-07-24 10:12:08 · 2411 阅读 · 0 评论 -
【数据挖掘导论】——数据质量
数据质量数据挖掘使用的数据通常是为其他用途收集或者收集的时候还没有明确目的。因此数据常常不能在数据的源头控制质量。为了避免数据质量的问题,所以数据挖掘着眼于两个方面:数据质量问题的检测和纠正(数据清理);使用可以容忍低质量数据的算法。测量和数据收集问题完美的数据在实际中几乎是不存在的,对于存在的数据质量问题,我们先定义测量误差和数据收集错误,然后考虑测量误差的各种问题:噪声原创 2014-07-26 09:26:13 · 2198 阅读 · 0 评论