数据挖掘与数据仓库的关系

本文将数据仓库比喻为矿坑,而数据挖掘则是深入矿坑挖掘的过程。文章强调了数据挖掘依赖于高质量、完整且经过整合的数据,并指出数据仓库与数据挖掘之间的紧密联系。有效的数据挖掘需要先建立数据仓库,以便从中提取有价值的信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

若将数据仓库比作矿坑,数据挖掘就是深入矿坑挖掘的工作。毕竟数据挖掘不是一种无中生有的魔术,也不是点石成金的炼金术,若没有足够丰富完整的数据,是很难期待数据挖掘能挖掘出什么有意义的信息的。

    从数据仓库中挖掘出对决策有用的信息和知识,是建立数据仓库与使用数据挖掘的最大目的。而如何从数据仓库挖掘有用的数据,则是数据挖掘的研究重点,二者的本质和过程是两码事。换句话说,数据仓库应先行建立完成,数据挖掘才能有效率地进行,因为数据仓库本身所含数据是干净(不会有错误的数据掺杂其中)、完整的,而且是经过整合的。因此两者的关系可描述为“数据挖掘是从巨大的数据仓库中找出有用信息的一种过程与技术”。

    表1-2   数据仓库与数据库的比较 中国统计网
\
\
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值