
项集挖掘
文章平均质量分 54
HitStuHan
这个作者很懒,什么都没留下…
展开
-
FP-Growth的python实现
文章目录前言一、环境配置二、读入文件1.数据集格式2.读入数据三、FP-Growth 前言 原文不知道是哪里的,但是确实不是自己写的。 一、环境配置 务必使用python=2.7的环境,因为在代码中,除了print的书写语法使用的是python=2.7的以外,最重要的是代码有部分内容是在循环处理dict(字典)时对字典本身进行了增删,这在pyhton=2.7是允许的,但是在python=3.7是绝对不允许的,如果使用的是python=3.7会报错!!!!! 二、读入文件 1.数据集格式 要求每个事务单独.原创 2021-06-16 17:01:47 · 660 阅读 · 0 评论 -
Apriori算法的Python实现
文章目录前言一、环境配置二、读入文件1.数据集格式2.读入数据三、Apriori四、全部代码 前言 本人代码能力确实有限,算法实现比较粗糙,并且在实现Apriori算法的时候,写了之后才想到了更好的实现方法,但是当时已经凌晨两点了,就懒得再改了,这也导致后续跑大数据集的时候很慢!!!!算法的原理主要是根据人民邮电出版社出版的《数据挖掘与分析 概念与算法》一书中p192,算法8.2 一、环境配置 这里我是用的是Anaconda3 python=3.7的环境,如果没有能力装Anaconda的话,只要一个py.原创 2021-06-16 16:53:25 · 2668 阅读 · 0 评论