
数据挖掘
Steve_Stone
西电er,在读研究僧。
github:
https://github.com/yohstone
展开
-
【数据挖掘】数据挖掘中的经典算法
最近的研究需要用到数据挖掘算法,然而当我使用时发现大三学过的数据挖掘知识都基本忘光了,需要重新进行学习,既然如此,我打算再重新对数据挖掘进行学习整理,这里整理一下数据挖掘领域的相关算法,做一个综述,以后再针对每个算法进行详解,以督促自己重新学习,认真整理、理解以及做好笔记,避免再次遗忘。很多数据挖掘算法也是机器学习算法,所以以下的一些算法将来我也会归入机器学习的类型之中。一、分类1.1. ...原创 2019-06-10 13:43:49 · 831 阅读 · 0 评论 -
【数据挖掘】关联分析基本概念与术语
本文介绍数据挖掘中关联分析的基本概念与基本术语。基本概念与术语1. 事务:一条数据也叫一条事务(transaction),数据的ID即事务的ID,简写为TID,表6-1是购物篮事务的例子,可以理解为顾客的购物记录。2. 二元表示 (这个术语暂时不理解也没关系)如表6-2所示,每行对应一个事务,每一列对应一个项。项用二元变量表示:如果项在事务中出现,则它的值是1,否则为0。因为通常认...原创 2019-06-15 21:06:48 · 2223 阅读 · 0 评论 -
【数据挖掘】关联分析之先验(Apriori)原理与Apriori算法
阅读本文之前建议先理解关联分析的基本概念与术语。传送门本文简单介绍关联分析中的先验(Apriori)原理与Apriori算法,持续更新与补充。先验(Apriori)原理原理简介:如果一个项集是频繁的,则它的所有子集一定也是频繁的。相反,如果一个项集是非频繁的,则它所有的超集也是非频繁的。此原理基于支持度的反单调性(anti-monotone):一个项集的支持度绝不会超过它的子集的支持度。...原创 2019-06-15 21:28:19 · 8619 阅读 · 1 评论