Hadoop知识点总结！！！

Hadoop2.x详解：四大模块、端口配置与分布式搭建

最新推荐文章于 2024-04-27 19:57:45 发布

原创

最新推荐文章于 2024-04-27 19:57:45 发布 · 1.3k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

这篇博客深入探讨了Hadoop2.x的四大核心模块，包括HDFS、MapReduce、YARN和Common，并详细列举了各组件的端口设置。此外，还详细介绍了Hadoop2.x的分布式环境搭建步骤，从Linux配置到Hadoop服务的启动。同时，讲解了HDFS与YARN的主要进程及其功能，以及MapReduce任务在YARN上的执行流程和五大过程，特别是shuffle阶段的细节。最后，讨论了自定义数据类型在MapReduce中的实现以及元数据的管理。

没什么好解释的，纯粹的干货分享。。。

Hadoop：
   1.Hadoop的四大模块:
       1.common:基础模块，用于支撑其他模块
       2.mapruedce：分布式计算框架
       3.YARN：分布式资源调度框架
       4.HDFS：分布式文件系统

   2.端口：
       1.HDFS：8082 webUI端口：8088
       2.YARN：8032 webUI端口：50070
       3.zookeeper：2181
       4.JobHistoryServer:19888

   3.Hadoop2.x分布式搭建的详细过程：
       一：linux相关：
           1.ip，网关，DNS
           2.hostname，本地域名解析映射（hosts）
           3.关闭防火墙，selinux
           4.ssh免密钥登陆
           5.ntp时间同步
           6.jdk配置
       二：Hadoop相关:
           1.上传，解压
           2.修改配置
               -》修改-evn.sh
                   hadoop、yarn、mapred
               -》core-site.xml
                   hdfs入口，临时文件目录
               -》hdfs-site.xml
   &n

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。