
《Machine Learning in Action》
机器学习实战学习心得
拉普拉斯智
学习、分享
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
《Machine Learning in Action》Chapter 12 FP-growth 学习笔记
在Apriori算法中,原始数据集需要遍历多次,如果数据量比较大,就会出现问题。 本文主要介绍一种的高效地发现频繁项集的FP-growth算法,该算法只需要遍历两次原始数据集。 值得注意的是,FP-growth算法也是基于Apriori原理的,即如果一个频繁项集是频繁的,那么它的子集也是频繁的。 以下摘自百度百科: FP-Growth算法是韩嘉炜等人在2000年提出的关联分析算法,它采取如下分治...原创 2020-05-05 21:22:09 · 386 阅读 · 0 评论 -
《Machine Learning in Action》Chapter 12 FP-growth python兼容性问题
1、遍历字典过程中不得删除元素 原书在createTree函数中包含如下一段删除不满足支持度的元素的代码: for k in headerTable.keys(): #remove items not meeting minSup if headerTable[k] < minSup: del(headerTable[k]) 在pytho...原创 2020-04-30 23:14:04 · 190 阅读 · 0 评论 -
《Machine Learning in Action》Chapter 11 Apriori(勘误)
本章除了python版本不兼容问题外,原书的代码在关联规则生成部分,也有很大的问题。 首先给出一个频繁项集{0,1,2,3}的关联规则生成图: 因为第一层没有用,排除第一层后,其他各层规则的右端项个数为1~3,假设频繁项集有n个项,那么规则右端的项个数为1至n-1。 下面看原书的代码: def rulesFromConseq(freqSet, H, supportData, brl, minCo...原创 2020-04-29 11:38:55 · 207 阅读 · 0 评论 -
《Machine Learning in Action》Chapter 11 Apriori 学习笔记
普遍联系是为唯物辩证法的一个基本观点。在日常生活中,联系是普遍存在的,一些销售冠军经常提到的关于啤酒和尿布的经典案例,便是联系的一种具体体现。经过一个多月的学习,这几天进入到了无监督学习的关联分析部分,与之前学习算法不同,这几天感觉到特别吃力(状态不佳,心浮气躁),本来想看完书后再找一些案例来充实一下这部分的内容,考虑了一下,还是先静下心来写篇博客总结一下吧,为接下来进行深入的学习打好基础。 ...原创 2020-04-29 11:14:41 · 324 阅读 · 0 评论 -
《Machine Learning in Action》Chapter 11 Apriori Python代码不兼容问题总结
问题1:AttributeError: ‘dict’ object has no attribute ‘has_key’ if not ssCnt.has_key(can): ssCnt[can]=1 else: ssCnt[can] += 1 错误原因:Python3中删除了has_key方法 解决方案:使用if key not in dict: if can not in ssCnt: ...原创 2020-04-24 21:11:52 · 344 阅读 · 0 评论