
Hadoop
文章平均质量分 73
盐神
资深菜鸟
展开
-
Hadoop/MapReduce性能优化------参数调优
Hadoop/MapReduce参数调优Hadoop性能优化涉及以下几个方面:1. CPU利用率2. 内存占用情况3. 磁盘I/O4. 网络流量 与工作负载相关的Hadoop性能优化需要关注以下三个方面:系统硬件、系统软件、Hadoop基础设施组件配置和调优。系统管理员可以通过各种配置选项对Hadoop集群进行优化。在建立和维护Hadoop集群原创 2015-09-08 22:25:01 · 925 阅读 · 0 评论 -
Hadoop计算中的Shuffle过程
Shuffle 过程是MapReduce的核心,也被称为奇迹发生的地方。要想理解MapReduce,Shuffle是必须要了解的。我看过很多相关的资料,但每次看 完都云里雾里的绕着,很难理清大致的逻辑,反而越搅越混。前段时间在做MapReduce job性能调优的工作,需要深入代码研究MapReduce的运行机制,这才对Shuffle探了个究竟。考虑到之前我在看相关资料而看不懂时很恼火,所 以在这转载 2015-09-12 11:32:34 · 358 阅读 · 0 评论 -
HDFS文件写入与读取
HDFS文件写入与读写副本(3个)选择策略说明:1. 若client为DataNode节点,那存储block时,规则为:副本1,同client的节点上;副本2,不同机架节点上;副本3,同第二个副本机架的另一个节点上;其他副本随机挑选。2. 若client不为DataNode节点,那存储block时,规则为:副本1,随机选择一个节点上;副本2,不同副本1,机架上;副本3,同副原创 2015-09-13 15:38:31 · 1445 阅读 · 0 评论