数据挖掘入门小知识

本文介绍了数据挖掘的基础知识,包括数据类型、数据挖掘的步骤、数据挖掘模式和相关内容。数据类型涉及数据库数据、数据仓库数据、事务数据和其他非结构化数据。数据挖掘步骤包括数据清理、集成、选择、变换、挖掘、模式评估和知识表示。数据挖掘模式涵盖分类、聚类、关联分析和预测。此外,文章还提到了统计学、机器学习、数据库和数据仓库等相关领域。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

什么是数据挖掘

数据挖掘(Data Mining)又称为:数据中的知识发现(KDD),也就是通过数据清理,数据集成,数据选择,数据变换,数据挖掘,模式评估,知识表示等一系列步骤,对数据进行分类,聚类,发现其中的关系或者离群点,来发现新的知识,新的价值。

(一)数据类型

1)数据库数据

数据库系统,又称为数据库管理系统(DBMS),一种关系型数据库。有唯一的关键字标识来表示一个对象,每个对象有若干属性,又包括若干元组。

一个二维表

2)数据仓库数据

多个数据库数据加上不同的维度,组成了数据仓库。

数据库立方体

3)数据库的事务

事务数据库中的每个记录都是一次事务,例如一次商品订单

4)其他数据

前1,2,3点都是结构化数据,还包含非结构化数据,例如音频,超文本,地图等

(二)数据挖掘的步骤

1)数据清理:消除噪声数据
2)数据集成:多种数据组合在一起
3)数据选择:选择相关数据
4)数据变换:汇总等操作将数据变换成适合挖掘的数据
5)数据挖掘:对数据进行
6)模式评估:根据某种模式来评估某种价值
7)知识表示:可视化表现

(三)数据挖掘模式

1)类和概念:特征化与区分

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值