Mahout0.9—Hadoop2.20—FPG关联规则算法

本文介绍了在Mahout0.9和Hadoop2.20环境下,使用FPGrowth算法进行关联规则挖掘的过程,包括FPG函数的运用和实际的FPG挖掘步骤。数据上传至Hadoop后,通过mahout seqdumper工具处理输出结果。

1. Mahout0.9—Hadoop2.20—FPG关联规则算法

1.1. FPG函数

目前Mahout0.9 无fpg函数,0.9之前版本有,但是在0.9中可以找到fpg的jar包;
mahout org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver 等价于 fpg;
1) fpg参数(mahout org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver)
-- minSupport,最小支持度,默认3
-- maxHeapSize,最大项集,默认50
-- numGroups,分组数量
-- splitterPattern,数据分割符,如:" \"[ ,\\t]*[,|\\t][ ,\\t]*\" ", "[ ,\t]*[,|\t][ ,\t]*"
-- numTreeCacheEntries,fpg树数量,Values: [5-10]", 默认"5"
-- method,sequential|mapreduce,并行或者串行计算;
-- encoding,编码,Default value: UTF-8", "UTF-8"
-- useFPG2,"2", "Use an alternate FPG implementation"

1.2 FPG挖掘

#上传数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值