3、数据挖掘:概念、应用与挑战

数据挖掘:概念、应用与挑战

1. 数据挖掘的定义

数据挖掘,简单来说,是从大量数据中提取或“挖掘”知识的过程。实际上,“数据挖掘”这个术语并不准确,更恰当的名称应该是“从数据中挖掘知识”,但这个表述过长。“知识挖掘”虽然简洁,却未能突出从大量数据中挖掘的特点。不过,“挖掘”一词生动地描绘了从大量原材料中找到少量珍贵信息的过程,因此“数据挖掘”这一术语被广泛使用。

与数据挖掘含义相近或略有不同的术语还有很多,如从数据中挖掘知识、知识提取、数据/模式分析、数据考古和数据探索等。很多人将数据挖掘与“知识发现(KDD)”视为同义词,也有人认为数据挖掘只是知识发现过程中的一个关键步骤。

知识发现过程是一个迭代的序列,包含以下步骤:
1. 数据清洗 :去除噪声和不一致的数据。
2. 数据集成 :可能会合并多个数据源。
3. 数据选择 :从数据库中检索与分析任务相关的数据。
4. 数据转换 :通过执行汇总或聚合操作等,将数据转换或整合为适合挖掘的形式。
5. 数据挖掘 :应用智能方法提取数据模式的关键过程。
6. 模式评估 :根据某些有趣性度量,识别真正代表知识的有趣模式。
7. 知识呈现 :使用可视化和知识表示技术将挖掘到的知识呈现给用户。

步骤 1 到 4 属于不同形式的数据预处理,为挖掘做准备。数据挖掘步骤可能与用户或知识库进行交互,有趣

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值