
hadoop集群问题
文章平均质量分 73
zhaogezhuoyuezhao
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hadoop-0.20.2-examples.jar grep 示例
1. 运行 root@ubuntu:/usr/hadoop# bin/hadoop jar hadoop-0.20.2-examples.jar grep input output 'dfs[a-z.]+' 10/06/20 05:58:07 INFO mapred.FileInputFormat: Total input paths to process : 17 10/06/20 0转载 2012-03-07 15:01:26 · 675 阅读 · 0 评论 -
linux配置java环境变量(详细)
转自http://www.cnblogs.com/samcn/archive/2011/03/16/1986248.html 一. 解压安装jdk 在shell终端下进入jdk-6u14-linux-i586.bin文件所在目录, 执行命令 ./jdk-6u14-linux-i586.bin 这时会出现一段协议,连继敲回车,当询问是否同意的时候,输入yes,回车。之后会在当前目录下生成一转载 2012-12-25 15:52:04 · 576 阅读 · 0 评论 -
Hadoop伪分布式与集群式安装配置
http://www.cnblogs.com/yedezhanghao/archive/2012/07/29/2614182.html 配置环境 配置前的说明 部署伪分布式与集群式Hadoop的绝大部分操作都是一样的,细节上区别在于集群式是在两台机子上部署的,两台机子都要执行下列操作,而伪分布式都是在一台机子上操作,以下全部操作如没有特别说转载 2012-12-24 22:56:33 · 6964 阅读 · 0 评论 -
轻松配置Linux双网卡虚拟路由
Linux系统越来越受到电脑用户的欢迎,于是很多人开始学习Linux时,学习Linux,你可能会遇到Linux双网卡虚拟路由问题,这里将介绍Linux双网卡虚拟路由的解决方法,在这里拿出来和大家分享一下。原因:进入实验室2个月了,不满意的不是特别多,也就是网络速度太慢,台式机和笔记本只能一个上网。 最近在思考着怎么才能用现有的硬件资源来让两台机器同时上网。想用一个网口的转换口,也就是那种原创 2012-12-25 12:59:30 · 2277 阅读 · 0 评论 -
hadoop伪分布式运行wordcount 实例Fedora14
[hadoop@master hadoop]$ bin/hadoop namenode format 12/03/09 23:41:08 INFO namenode.NameNode: STARTUP_MSG: /************************************************************ STARTUP_MSG: Starting NameNo原创 2012-03-09 23:45:32 · 675 阅读 · 0 评论 -
Hadoop的运行痕迹http://www.cnblogs.com/JohnLiang/archive/2011/11/9.html
在使用hadoop的时候,可能遇到各种各样的问题,然而由于hadoop的运行机制比较复杂,因而出现了问题的时候比较难于发现问题。 本文欲通过某种方式跟踪Hadoop的运行痕迹,方便出现问题的时候可以通过这些痕迹来解决问题。 一、环境的搭建 为了能够跟踪这些运行的痕迹,我们需要搭建一个特殊的环境,从而可以一步步的查看上一节提到的一些关键步骤所引起的变化。 我们首先搭建转载 2012-03-09 20:51:16 · 6150 阅读 · 0 评论 -
Hadoop格式化HDFS报错java.net.UnknownHostException: localhost.localdomain: localhost.localdomain
异常描述 在对HDFS格式化,执行hadoop namenode -format命令时,出现未知的主机名的问题,异常信息如下所示: [plain] view plaincopy [shirdrn@localhost bin]$ hadoop namenode -format 11/06/22 07:33:31 INFO转载 2012-03-09 22:09:01 · 3261 阅读 · 0 评论 -
Word Count
http://tlyxy228.blog.163.com/blog/static/181090120105208322823/ map(String key1, String value1): // key1: doc name // value1: doc contents(words) for each word w in value: EmitIntermediat转载 2012-03-07 15:06:42 · 446 阅读 · 0 评论 -
在Linux单机上运行Hadoop-0.19.0实例http://blog.youkuaiyun.com/shirdrn/article/details/5781776
Hadoop-0.19.0的代码可以到Apache上下载,链接为http://archive.apache.org/dist/hadoop/core/hadoop-0.19.0/,我使用的Linux机器是RHEL 5,Linux上安装的Java版本为1.6.0_16,并且JAVA_HOME=/usr/java/jdk1.6.0_16。 实践过程 1、ssh无密码验证转载 2012-03-09 22:53:14 · 1292 阅读 · 0 评论 -
hodoop 伪分布式环境配置
一. 概要 经过几天的调试,终于在Linux Cent OS 5.5下成功搭建Hadoop测试环境。本次测试在一台服务器上进行伪分布式搭建。Hadoop 伪分布式模式是在单机上模拟 Hadoop 分布式,单机上的分布式并不是真正的伪分布式,而是使用线程模拟分布式。Hadoop 本身是无法区分伪分布式和分布式的,两种配置也很相似,唯一不同的地方是伪分布式是在单机器上配置,数据节点和转载 2012-03-07 19:31:57 · 751 阅读 · 0 评论 -
朴素认识Map和Reduce
一、Map阶段一般做三件事情: 1. 切分输入 2. 变换输入为输出 3. 执行可选的Combine PS: - 用不用Combine,一方面取决于数据的特征(重复Key的多寡);另一方面就是网络带宽(网络速度很快时,Combine提高的性能有限,甚至不会提高性能)。 - Map的幂等性(相同的输入将产生完全相同的输出)很重要,如果Map不是幂等的,两次运行的结果可能会有不同转载 2012-03-07 14:59:00 · 512 阅读 · 0 评论 -
Hadoop格式化HDFS报错java.net.UnknownHostException: localhost.localdomain: localhost.localdomain
异常描述 在对HDFS格式化,执行hadoop namenode -format命令时,出现未知的主机名的问题,异常信息如下所示: [plain] view plaincopy [shirdrn@localhost bin]$ hadoop namenode -format 11/06/22 07:33:31 INFO namenode.NameNode: STARTUP_M转载 2012-03-07 10:02:04 · 1257 阅读 · 0 评论 -
博客
http://blog.sciencenet.cn/home.php?mod=space&uid=425672翻译 2012-03-07 15:34:16 · 313 阅读 · 0 评论 -
Linux下安装RPM文件包
http://blog.youkuaiyun.com/sole_ghost/article/details/1376391 1.如何安装rpm软件包 rmp软件包的安装可以使用程序rpm来完成。执行下面的命转载 2012-12-25 19:51:39 · 530 阅读 · 0 评论