
HADOOP
文章平均质量分 81
qinsi201208
这个作者很懒,什么都没留下…
展开
-
Ubuntu伪分布式环境下Mahout安装与Eclipse开发环境搭建
Mahout是Apache下的开源的机器学习算法库,是基于Hadoop的.在搭建完分布式的Hadoop之后,可以搭建Mahout环境和开发环境.环境:Ubuntu 12.10jdk 1.7Hadoop 0.20.2Eclipse 3.5.2Mahout 0.7Maven 3.1.1第一步:Mahout的安装与配置 参见Ruthless的博客http://www.原创 2013-11-22 14:55:25 · 2037 阅读 · 0 评论 -
Hadoop词频统计源码运行与分析
Hadoop的词频统计,就相当于Java的Helloworld.下面就来运行这个词频统计的例子和进行源码分析.前提是已经搭好hadoop的Eclipse开发环境,具体看我的前面两篇博客.第一步,在Eclipse里面新建一个Hadoop工程,然后点击Finish即可,如下图所示:第二步,在WordCount工程中,新建一个WordCount类,其代码如下:import原创 2013-11-24 11:32:55 · 2726 阅读 · 0 评论 -
ubuntu环境下搭建Hadoop伪分布式环境和Eclipse开发环境
ubuntu环境下搭建Hadoop伪分布式环境和Eclipse开发环境环境:Ubuntu 12.10jdk 1.7Hadoop 0.20.2Eclipse 3.5.2Hadoop的Eclipse插件 hadoop-0.20.2-eclipse-plugin.jar第一步:安装Ubuntu操作系统,下载ubuntu-12.10-desktop-i386光盘镜像文件,用解压原创 2013-11-21 17:07:08 · 1545 阅读 · 0 评论