数据挖掘学习--数据挖掘基础概念

本文介绍了数据挖掘中的关键概念,包括数据模式的定义及其评估标准,数据挖掘与关联性,以及数据挖掘的不同分类方式。深入探讨了特性化、关联分析、分类预测、聚类和孤立点分析等核心方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一,数据模式

概念/类描述:特性化和区分 归纳,总结和对比数据的特性

关联分析

分类和预测

可以用来预报某些未知的或丢失的数据值。

聚类分析

将类似的数据归类到一起,形成一个新的类别进行分析 最大类内的相似性和最小化类间的相似性。比如画圈。

孤立点分析

孤立点:一些与数据的一般行为或模型不一致的孤立的数据。 通常孤立点被作为“噪音”或异常被丢弃。但是在欺事件中可以通过罕见事件进行孤点分析而得出结论。比如银行信用卡 趋势和演变分析 描述行为随事件变化的对象的发展规律或趋势。比如时间数据库 趋势和偏差:回归分析 序列模式匹配:周期性分析 基于类性的分析 其它定向模式或统计分析。

曾转载过一篇博客说明几类问题http://www.cnblogs.com/wujin/archive/2013/05/14/3078102.html

二.数据模式是否有趣

1.它需要是被人理解
2.在某种程度上,对于新的或测试的数据是有效的
3.具有潜在效用
4.新颖的
5.符合用户确信的某种假设

模式兴趣度的客户和主观度量
客观度量:基于所发现模式的结构和关于它们的统计,比如支持度,置信度等。
主观度量:基于用户对数据的判断,比如:出乎意料的,新颖的,可行动的等等。

搜索有趣的模式:数据挖掘算法的最优化问题
1.首先生成所有模式然后过滤那些无趣的
2.仅仅生成有趣的模式-数据查询优化

三.数据挖掘关联

要想学好数据挖掘,必须首先需了解以下内容

数据库系统
统计学
机器学习
算法
可视化
其他学科

四.数据挖掘的分类

一般功能分类
描述性的数据挖掘
预测性的数据挖掘
不同视角,不同的分类
根据所挖掘的数据库类型分类
根据所挖掘的知识类型分类
特征分析,区分,关联分析,分类聚类,孤立点分析
根据挖掘所用的技术分类
面向数据库的挖掘,数据仓库,OLAP
根据数据挖掘的应用分类
金融,电信,银行

转载于:https://www.cnblogs.com/wujin/p/3219401.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值