
Hadoop
文章平均质量分 73
__鸿
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hadoop学习笔记(五):MapReduce的类型与格式
在MapReduce中,map和reduce函数的输入和输出都是键值对(key/value)。1. MapReduce函数的常规格式MapReduce的函数一般遵循以下常规格式:map:(K1, V1)—> list(K2,V2)combine:(K2,list(V2))—> list(K2,V2)partition:(K2,V2)—> integerreduce:原创 2014-07-25 23:55:37 · 2295 阅读 · 0 评论 -
Hadoop学习笔记(二):MapReduce的进度和状态
MapReduce的状态和进度原创 2014-07-22 17:01:05 · 8898 阅读 · 0 评论 -
Hadoop学习笔记(三):作业调度器
早期的作业调度使用FIFO(First In First Out)调度算法,可以设置属性mapred.job.priority或者JobClient的setJobPriority( )方法来设定作业优先级,可配置的优先级有5个:VERY_HIGH, HIGH, NORMAL, LOW, VERY_LOW。 除了FIFO调度器之外,还有两个多用户调度器,分别是Fair Schedul原创 2014-07-23 14:55:17 · 1058 阅读 · 0 评论 -
Hadoop学习笔记(一):MapReduce工作机制
MapReduce的运行过程如下图所示:原创 2014-07-21 17:54:28 · 1301 阅读 · 0 评论 -
Hadoop学习笔记(四):Shuffle阶段
1. 定义 shuffle是指map任务输出到reduce任务输入的过程。2. 目的 在Hadoop集群中,大部分map任务与reduce任务在不同的节点执行。因此,reduce任务在执行时需要跨节点去获取map的输出结果。如果集群上有很多作业,那么网络资源消耗会很严重,需要最大化减少不必要的资源。另外,如果map的输出和reduce的输入只是简单的磁盘原创 2014-07-23 23:19:12 · 3075 阅读 · 1 评论 -
解决Hbase的几个常见bug
1. 在Eclipse中使用hbase和hadoop时遇到以下bug:原创 2014-07-12 20:01:06 · 2713 阅读 · 0 评论 -
Hadoop2.2.0 + HBase0.96 伪分布式安装
本文详细介绍Hadoop2.2.0和HBase0.96的伪分布式安装。在开始安装之前,先看Hadoop和HBase对应的版本支持,帮助入门的朋友少走弯路,避免版本不同导致安装失败的问题。原创 2014-06-07 13:30:48 · 1014 阅读 · 0 评论