数据挖掘 Chapter 1

本文探讨了数据挖掘的核心概念,即从应用数据中发现有趣模式的过程,介绍了知识发现(KDD)的概念,从数据库到数据仓库的演变,以及数据挖掘在智能商务等领域的应用。文章还概述了数据挖掘的主要功能,包括类/概念描述、频繁模式挖掘、预测分析、聚类分析和离群点分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据挖掘 Chapter 1

数据挖掘的核心是从应用数据中发现有趣的模式

KDD

Knowledge discovery in database

知识的发现过程,从数据库到数据仓库,通过数据挖掘提炼模式,最终表示为知识。

客串——对关系型数据库的一段描述:

关系型数据库是表的汇集,每个表都被赋予一个唯一的名字。每个表都包含一组属性(列或字段),并且通常存放大量元组(记录或行)。关系表中的每个元组代表一个对象,被唯一地用关键字标识,并被一组属性值描述。

数据仓库:

一个从多个数据源搜集的信息存储库

需要是发明之母

数据挖掘的功能
  • 类/概念描述:特征化与区分
  • 挖掘频繁模式、关联与相关性
  • 用于预测分析的分类与回归
  • 聚类分析
  • 离群点分析(异常点挖掘)

在这里插入图片描述

相关领域
  • 智能商务
  • 跨学科(例如将数据挖掘技术和信息检索和自然语言处理方法融合到一起);
  • 交叉挖掘:数据挖掘过程应该是高度交互的
  • 保护隐私的数据挖掘
reference

Han J. Data Mining: Concepts and Techniques[M]. 2005.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值