
决策树算法
文章平均质量分 91
fansy1990
这个作者很懒,什么都没留下…
展开
-
Mahout决策树算法源码分析(3)
part3主要分析下名为“decision forest builder”的Job的操作,上篇说到这个Job只有Mapper,所以也就是针对这个Mapper,即Step1Mapper类的分析: Step1Mapper.java在org.apache.mahout.classifier.df.mapreduce.partial中,打开这个源文件,可以看到其操作主要有以下三点: 1. setup(原创 2013-01-26 14:06:27 · 3355 阅读 · 7 评论 -
Mahout决策树算法源码分析(3-1)建树实战
上篇主要分析了Partial Implementation的建树主要操作,下面就自己使用mahout的源码自己实战一下: (注意:所建的MR工程需要导入下面的包:http://download.youkuaiyun.com/detail/fansy1990/5030740,否则看不到console里面的提示) 新建如下的类文件: package org.fansy.forest.test; imp原创 2013-01-26 14:33:17 · 3378 阅读 · 0 评论 -
Mahout决策树算法源码分析(4)
今天来说,应该是把所有Partial Implementation的内容分析完了(当然也只是分析了属性是离散值的情况的数据,而非离散的并没有分析),下面就说下Partial Implementation实战的第三部分:TestForest,这个源文件在$MAHOUT_HOME/example/src/main/java/org/apache/mahout/classifier/df/mapredu原创 2013-01-26 20:44:01 · 3705 阅读 · 2 评论 -
Mahout决策树算法源码分析(2)
决策树Partial Implementation源码的第二部分为:BuildForest,其源码所在位置为:MAHOUT_HOME/example/src/main/java/org/apache/mahout/classifier/df/mapreduce/BuildForest.java,现对其进行简要分析: 打开源码可以看到,BuildForest有如下四个步骤: (1)创建一个Dec原创 2013-01-22 21:29:55 · 2730 阅读 · 4 评论