mahout
文章平均质量分 73
iteye_14058
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
聚类Clustering -Clustering of synthetic control data
1.下载Mahout http://www.apache.org/dist//mahout/0.4/ 2.解压 tar zxvf mahout-distribution-0.4.tar.gz 3.算法列表 ./bin/mahout -h 显示出当前mahout支持的所有算法 [size=xx-large]聚类Clustering[/size] [size=x-l...原创 2011-02-24 10:30:46 · 278 阅读 · 0 评论 -
聚类Clustering - 可视化样本聚类(Visualizing Sample Clusters)
[size=x-large]介绍:[/size] Mahout 提供了可视化样本聚类的事例,根据以下聚类算法: * Canopy Clustering * Dirichlet * Kmeans * FuzzyKMeans * MeanShift [size=x-large]预先准备[/size] 为了可视化聚类,你需要执行mahout-e...2011-02-24 11:52:05 · 1085 阅读 · 0 评论 -
分类Classification-二十个新闻组(Twenty Newsgroups)
[size=x-large]二十个新闻组分类列子[/size] [size=large]介绍[/size] 这二十个新闻组数据集合是收集大约20,000新闻组文档,均匀的分布在20个不同的集合。这20个新闻组集合采集最近流行的数据集合到文本程序中作为实验,根据机器学习技术。例如文本分类,文本聚集。我们将使用Mahout的Bayes Classifier创造一个模型,它将一个新文档分类到这2...2011-02-24 13:40:15 · 1287 阅读 · 0 评论 -
分类Classification-维基百科例子(Wikipedia Bayes Example)
[size=large]介绍[/size] 这个Mahout例子的源码来自一个分类维基百科数据的导出工具,可以Naive贝叶斯或者附加的 Naive贝叶斯在Mahout的实现。下面将描述这个例子,导出维基的数据,然后分类到不同的块。这些块是根据国家进一步分类的。根据这些分割,分离器训练使能够预测,一个未曾看到过的文章被分类到那个国家。 [size=large]运行例子[/size] 1....2011-02-24 14:59:21 · 312 阅读 · 0 评论 -
怎样适当的评估分布式Mahout
如果没有Watchmaker程序,你将不得不创建一个实例:StandaloneEvolutionEngine。在TSP例子里,已经做好了EvolutionaryTravellingSalesman类: [code="java"]private EvolutionEngine getEngine(CandidateFactory candidateFactory, EvolutionaryOper...2011-02-24 15:22:47 · 113 阅读 · 0 评论 -
例子Breiman
[size=large]介绍[/size] 快速的介绍怎么运行Breiman例子。在Breiman页实现了测试步骤描述。 如下是基础的算法: 。重复I次迭代 。每次迭代执行: 。有10%的数据从测试数据中分离 。编译2个独立的森林,用来训练集合。一个使用m=int(log2(M)+1) (称为随机输入),另外一个使用m=1(称为单一输入) 。选择一个森林...2011-02-24 16:16:03 · 215 阅读 · 0 评论 -
Mahout基于hadoop的推荐器(Recommender)
[size=x-large]介绍[/size] 本页主要描述,怎么在hadoop集群上运行Mahout Taste的推荐器 [size=x-large]步骤[/size] [size=large]在那单个机器上测试[/size] 进入事例目录,执行: [code="java"]mvn -q exec:java -Dexec.mainClass="org.apache.mahout.c...2011-02-24 16:41:41 · 293 阅读 · 0 评论
分享