
数据挖掘
htfenght
这个作者很懒,什么都没留下…
展开
-
挖掘频繁模式、关联和相关性:基本概念和方法
基本概念频繁模式挖掘搜索给定数据及中国反复出现的联系。购物篮分析:一个例子频繁项集、闭项集和关联规则规则的支持度和置信度是规则兴趣度的两种度量。一个例子:支持度:支持度为2%,意味着分析的所有事务的2%显示计算机和杀毒软件被同时购买置信度:置信度60%,意味着购买计算机的顾客60%也购买了杀毒软件。在典型情况下,如果满足最小支持度阈值和最小置信度阈值,关联规则被认为是有...原创 2018-11-09 16:12:21 · 593 阅读 · 0 评论 -
高级聚类分析
原文:https://blog.youkuaiyun.com/fjssharpsword/article/details/79291001高级聚类分析基于概率模型的聚类研究一个对象属于多个簇的聚类主题。模糊簇模糊集S是整体对象集X的一个子集,允许X中的每个对象都具有一个属于S的0到1之间的隶属度。给定对象的集合,一个簇就是对象的一个模糊集,这种簇就是模糊簇,一个聚类包含多个模糊簇。模糊聚类就是划分...转载 2018-11-12 14:12:42 · 1128 阅读 · 0 评论 -
聚类评估
聚类概念聚类是一个把数据对象划分为多个簇或者多个组的过程,使得一个簇内的对象具有很高的相似性,但与其他簇内的对象不相似。聚类算法属于无监督学习聚类分析概念聚类分析是一个把数据对象划分为子集的过程,每个子集是一个簇,使得簇中的对象彼此相似,但与其他簇中的对象不相似,由聚类分析产生簇的集合叫做聚类。至关重要的区别是,聚类可以自动地发现这些分组是聚类分析的突出优点。应用场景客户分类文...转载 2018-11-11 17:23:18 · 9617 阅读 · 1 评论 -
离群点检测
离群点检测离群点检测时找出其行为很不同于预期对象的过程,这种对象称为离群点或异常。离群点检测和聚类分析是两项高度相关的任务。离群点和离群点分析什么是离群点离群点是一个数据对象,它显著不同于其他数据对象,好像他是被不同的机制产生的一样。离群点不同于噪声数据,噪声数据是被观测变量的随机误差或方差,噪声数据在数据分析中不是令人感兴趣的。离群点是有趣的,因为怀疑产生他们的机制不同于产生其他...原创 2018-11-13 16:01:58 · 2259 阅读 · 0 评论 -
数据仓库与联机分析处理
本文为《数据挖掘:概念与技术》中“数据仓库与联机分析处理”的阅读笔记。数据仓库与联机分析处理ETL:用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。数据仓库提供联机分析处理(OLAP)工具,用于各种粒度的多维数据的交互分析,有利于有效的数据泛化和数据挖掘。数据立方体,是一种用于数据和OLAP以及OLAP操作(如上卷、下钻、切片...转载 2018-11-08 14:46:30 · 3020 阅读 · 0 评论 -
数据预处理
数据预处理为什么要进行数据预处理?数据质量数据质量包括准确性、完整性、一致性、时效性、可信性和可解释性数据质量的三个要素:准确性、完整性、一致性。不正确、不完整和不一致的数据是现实世界的大型数据库和数据仓库的共同特点数据预处理的主要任务数据清理数据集成数据规约数据变换数据清理现实世界的数据一般是不完整的、有噪声的和不一致的。数据清理例程试图填充缺失的、光滑噪声并...原创 2018-11-07 15:26:22 · 1594 阅读 · 0 评论 -
数据挖掘引论
数据挖掘引论为什么进行数据挖掘简单的说就是信息化时代,数据量太大,仅仅靠人自己来发现信息中的可用信息代价太高,所以数据挖掘崛起。随着数据挖掘崛起,出现了一个名词,数据仓库,它是一种多个异构数据源在但个站点以统一的模式组织的存储,数据仓库技术包括数据清理、数据集成和联机分析处理(OLAP)。下图是数据仓库技术的演变。什么是数据挖掘许多人把数据挖掘视为另一个流行术语数据中的知识发现(KD...原创 2018-11-02 15:22:43 · 424 阅读 · 1 评论 -
认识数据
数据对象与属性类型数据集由数据对象组成,一个数据对象代表一个实体。属性是一个数据字段,表示数据对象的一个特征标称属性的值是一些符号或者事务的名称二元属性是一种标称属性,只有两个类别或者状态:0或者1序数属性可能的值之间具有有意义的序或者秩评定,但是相继值之间的差未知(如大中小)数值属性区间标度属性:属性涌向等的单位尺度度量。比率标度属性:属性是具有固定零点的数值属性。离散...原创 2018-11-06 23:01:33 · 1299 阅读 · 0 评论 -
数据挖掘的发展趋势和研究前沿
挖掘复杂的数据类型数据挖掘的其他方法数据挖掘应用数据挖掘的社会数据挖掘的发展趋势原创 2018-11-14 17:47:08 · 8872 阅读 · 0 评论