JDK安装
https://blog.youkuaiyun.com/simple_start/article/details/94218246
hadoop的安装部署
安装方式:伪分布式,让进程跑在一台机器上,只是他们的端口不一样
文档:
http://hadoop.apache.org/docs/r2.7.6/hadoop-project-dist/hadoop-common/SingleCluster.html
- 使用rz命令上传
hadoop-2.7.3.tar.gz
2、解压
tar -zxvf hadoop-2.7.3.tar.gz -C ../modules/
3、Hadoop目录结构

删除一些无用文件和目录:
rm -rf bin/*.cmd
rm -rf sbin/*.cmd
rm -rf share/doc/
4、修改环境变量
*-env.sh:hadoop-env.sh、yarn-env.sh、mapred-env.sh



5、common模块
core-site.xml

本文详细介绍了Hadoop的安装部署过程,包括JDK的安装、Hadoop的伪分布式配置、HDFS和Yarn模块的设置,以及MapReduce的测试。在HDFS模块中,讲解了如何启动和验证HDFS服务,而在Yarn模块中,重点在于资源管理和任务调度的启动与检查。最后,通过MapReduce程序的运行,验证了Hadoop集群的正确性。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



