若将数据仓库比作矿坑,数据挖掘就是深入矿坑挖掘的工作。毕竟数据挖掘不是一种无中生有的魔术,也不是点石成金的炼金术,若没有足够丰富完整的数据,是很难期待数据挖掘能挖掘出什么有意义的信息的。
从数据仓库中挖掘出对决策有用的信息和知识,是建立数据仓库与使用数据挖掘的最大目的。而如何从数据仓库挖掘有用的数据,则是数据挖掘的研究重点,二者的本质和过程是两码事。换句话说,数据仓库应先行建立完成,数据挖掘才能有效率地进行,因为数据仓库本身所含数据是干净(不会有错误的数据掺杂其中)、完整的,而且是经过整合的。因此两者的关系可描述为“数据挖掘是从巨大的数据仓库中找出有用信息的一种过程与技术”。
表1-2 数据仓库与数据库的比较 中国统计网
从数据仓库中挖掘出对决策有用的信息和知识,是建立数据仓库与使用数据挖掘的最大目的。而如何从数据仓库挖掘有用的数据,则是数据挖掘的研究重点,二者的本质和过程是两码事。换句话说,数据仓库应先行建立完成,数据挖掘才能有效率地进行,因为数据仓库本身所含数据是干净(不会有错误的数据掺杂其中)、完整的,而且是经过整合的。因此两者的关系可描述为“数据挖掘是从巨大的数据仓库中找出有用信息的一种过程与技术”。
表1-2 数据仓库与数据库的比较 中国统计网
数据挖掘与数据仓库
本文将数据仓库比喻为矿坑,而数据挖掘则是深入矿坑挖掘的过程。文章强调了数据挖掘依赖于高质量、完整且经过整合的数据,并指出数据仓库与数据挖掘之间的紧密联系。有效的数据挖掘需要先建立数据仓库,以便从中提取有价值的信息。


4919

被折叠的 条评论
为什么被折叠?



