
mahout
文章平均质量分 73
iteye_14058
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
聚类Clustering -Clustering of synthetic control data
1.下载Mahouthttp://www.apache.org/dist//mahout/0.4/2.解压tar zxvf mahout-distribution-0.4.tar.gz3.算法列表./bin/mahout -h显示出当前mahout支持的所有算法[size=xx-large]聚类Clustering[/size][size=x-l...原创 2011-02-24 10:30:46 · 268 阅读 · 0 评论 -
聚类Clustering - 可视化样本聚类(Visualizing Sample Clusters)
[size=x-large]介绍:[/size]Mahout 提供了可视化样本聚类的事例,根据以下聚类算法: * Canopy Clustering * Dirichlet * Kmeans * FuzzyKMeans * MeanShift[size=x-large]预先准备[/size]为了可视化聚类,你需要执行mahout-e...2011-02-24 11:52:05 · 1071 阅读 · 0 评论 -
分类Classification-二十个新闻组(Twenty Newsgroups)
[size=x-large]二十个新闻组分类列子[/size][size=large]介绍[/size]这二十个新闻组数据集合是收集大约20,000新闻组文档,均匀的分布在20个不同的集合。这20个新闻组集合采集最近流行的数据集合到文本程序中作为实验,根据机器学习技术。例如文本分类,文本聚集。我们将使用Mahout的Bayes Classifier创造一个模型,它将一个新文档分类到这2...2011-02-24 13:40:15 · 1257 阅读 · 0 评论 -
分类Classification-维基百科例子(Wikipedia Bayes Example)
[size=large]介绍[/size]这个Mahout例子的源码来自一个分类维基百科数据的导出工具,可以Naive贝叶斯或者附加的 Naive贝叶斯在Mahout的实现。下面将描述这个例子,导出维基的数据,然后分类到不同的块。这些块是根据国家进一步分类的。根据这些分割,分离器训练使能够预测,一个未曾看到过的文章被分类到那个国家。[size=large]运行例子[/size]1....2011-02-24 14:59:21 · 296 阅读 · 0 评论 -
怎样适当的评估分布式Mahout
如果没有Watchmaker程序,你将不得不创建一个实例:StandaloneEvolutionEngine。在TSP例子里,已经做好了EvolutionaryTravellingSalesman类:[code="java"]private EvolutionEngine getEngine(CandidateFactory candidateFactory, EvolutionaryOper...2011-02-24 15:22:47 · 102 阅读 · 0 评论 -
例子Breiman
[size=large]介绍[/size]快速的介绍怎么运行Breiman例子。在Breiman页实现了测试步骤描述。如下是基础的算法:。重复I次迭代。每次迭代执行: 。有10%的数据从测试数据中分离 。编译2个独立的森林,用来训练集合。一个使用m=int(log2(M)+1) (称为随机输入),另外一个使用m=1(称为单一输入) 。选择一个森林...2011-02-24 16:16:03 · 193 阅读 · 0 评论 -
Mahout基于hadoop的推荐器(Recommender)
[size=x-large]介绍[/size]本页主要描述,怎么在hadoop集群上运行Mahout Taste的推荐器[size=x-large]步骤[/size][size=large]在那单个机器上测试[/size]进入事例目录,执行:[code="java"]mvn -q exec:java -Dexec.mainClass="org.apache.mahout.c...2011-02-24 16:41:41 · 285 阅读 · 0 评论