1. Mahout0.9—Hadoop2.20—FPG关联规则算法
1.1. FPG函数
目前Mahout0.9 无fpg函数,0.9之前版本有,但是在0.9中可以找到fpg的jar包;mahout org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver 等价于 fpg;
1) fpg参数(mahout org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver)
-- minSupport,最小支持度,默认3
-- maxHeapSize,最大项集,默认50
-- numGroups,分组数量
-- splitterPattern,数据分割符,如:" \"[ ,\\t]*[,|\\t][ ,\\t]*\" ", "[ ,\t]*[,|\t][ ,\t]*"
-- numTreeCacheEntries,fpg树数量,Values: [5-10]", 默认"5"
-- method,sequential|mapreduce,并行或者串行计算;
-- encoding,编码,Default value: UTF-8", "UTF-8"
-- useFPG2,"2", "Use an alternate FPG implementation"
1.2 FPG挖掘
#上传数据

本文介绍了在Mahout0.9和Hadoop2.20环境下,使用FPGrowth算法进行关联规则挖掘的过程,包括FPG函数的运用和实际的FPG挖掘步骤。数据上传至Hadoop后,通过mahout seqdumper工具处理输出结果。
最低0.47元/天 解锁文章
2719

被折叠的 条评论
为什么被折叠?



