
数据仓库与数据挖掘
文章平均质量分 96
数据仓库与数据挖掘学习
每天都要加油呀!
这些博客是笔者在学习过程中的笔记和心得,如有谬误,望君斧正
展开
-
数据挖掘十大算法之分类算法(决策树模型)
数据挖掘十大算法之分类算法(决策树模型)接上篇文章分类介绍及评价指标我们讨论了分类算法中,分类模型的选择是非常关键的一步,接下来我们分析常用的分类模型——决策树模型在本文中没有举例,全部为概念,所有举例都在ID3算法的学习中1. 决策树的概念决策树是一种树形结构,决策树包含一系列规则,一般我们使用决策树将大型记录集分割为小记录集,通过每一次连续分割,结果集中的成员彼此变得越来越相似。例如我们想用决策树来分类下面表中的数据,来分析什么样的人群会购买电脑:那我们可以生成下图所示的决策树,可以看到,原创 2022-04-07 22:34:51 · 3221 阅读 · 0 评论 -
数据挖掘十大算法之分类算法(分类介绍及评价指标)
数据挖掘十大算法之分类算法(分类介绍及评价指标)接上篇文章,接下来学习挖掘算法中的分类算法:首先我们应该知道数据挖掘十大算法中可以简单的进行分类,分为分类算法,聚类算法和关联规则三大类算法分类连接分析:PageRank关联分析:Apriori分类算法:ID3、C4.5,朴素贝叶斯,SVM,KNN,Adaboost,CART聚类算法:K-Means,EM这里研究分类算法中的决策算法——ID3算法,有ID3算法的知识背景后分析C4.5算法就会容易很多1. 分类相关知识1.1 分类的概念原创 2022-04-07 22:31:38 · 15724 阅读 · 4 评论 -
利用weka进行数据挖掘——基于Apriori算法的关联规则挖掘实例
文章目录1. weka安装2. 先分析一个Apriori算法的关联规则挖掘实例3. 利用weka进行数据挖掘3.1 将数据转为ARFF格式3.2 利用weka进行分析4. 参考文章首先,如果不熟悉weka的使用的话,可以从我的git仓库里面拉取一下weka的相关教程,仓库里面还有包含此次实例的所有资源1. weka安装我们可以在weka的官网上下载weka软件:weka官网如果下载速度慢的话也可以直接从我的git仓库里面拉取这个软件,软件是win64位的weka-3-8-6然后找到对应版本:原创 2022-03-30 18:31:41 · 18084 阅读 · 9 评论 -
数据挖掘十大算法之Apriori算法
文章目录1. “啤酒与尿布”的案例2. Aprior算法核心术语事物集记录(事务)项目(项)项目集(项集)K项集支持度(Support)置信度(Confidence)最小支持度(min_support)最小置信度(min_confidence)提升度频繁K项(目)集候选K项(目)集3. Aprior算法的三大性质(关联规则的三大性质)4. Aprior算法实现过程5. 数据挖掘5.1 寻找关联属性5.2 生成关联规则5.3 更加严谨的栗子6. Aprior算法的优缺点6.1 改进Aprior算法6.2 F原创 2022-03-26 10:44:56 · 11419 阅读 · 0 评论