
数据挖掘与知识发现
也是这学期,笔记又+1(wwwww)
_qz
这个作者很懒,什么都没留下…
展开
-
三、关联规则挖掘理论和算法
一、基本概念与解决方法1. 事务数据库交易数据库又称事务数据库,尽管它们英文名词一样,但事务数据库更具有普遍性。一个事务数据库中的关联规则挖掘可以描述如下:设 I = { i1,2,i3...,im}是一个项目集合 ,事务数据库D ={t1,t2,...tn}是由一系列具有唯一标识的TID事务组成。每一个事务ti(i =1,2,...,n)都对应I上的一个子集。2. 定义定义3.1:支持度(集合在 I 中出现的次数)定义3.2:频繁项目集对于项目集I,在事务数据库D中所有满原创 2020-10-04 22:04:27 · 2079 阅读 · 1 评论 -
2. 知识发现过程与应用结构
文章目录一、知识发现的基本过程1. 问题定义阶段2. 数据抽取阶段的功能3. 数据预处理阶段的功能4. 数据挖掘阶段的功能5. 知识评估阶段的功能二、数据库中的知识发现处理过程模型1. 阶梯处理过程模型2. 螺旋处理过程模型3. 以用户为中心的处理模型4. 联机KDD模型5. 支持多数据源多知识模式的KDD处理模型三、知识发现软件或工具的发展1. 独立的知识发现软件2. 横向的知识发现工具集3. 纵向的知识发现解决方案四、知识发现项目的过程化管理1. IM1的任务与目标2. IM2的任务与目标3. IM3的原创 2020-09-28 11:43:14 · 1910 阅读 · 0 评论 -
2. 数据预处理
文章目录一、数据预处理的目的1. 数据清理(Data Cleaning)2. 数据集成(Data Integration)3. 数据变换(Data Transformation)4、数据归约5、 总结二、数据清理1、 空缺值的处理(1) 忽略元组(2) 使用同一类所有样本该属性的平均值(3)使用最可能的值2、 噪声数据的处理(1)分箱(Binning)(2) 聚类(Clustering)(3) 回归(Regression)(4)总结3、 不一致数据的处理三、数据集成和数据变换1. 数据集成2. 数据集成需要原创 2020-09-24 22:32:20 · 823 阅读 · 0 评论