安装方式:伪分布式,让进程跑在一台机器上,只是他们的端口不一样!
Hadoop框架安装部署
都属于Java进程,其实就是JVM基础,运行服务
HDFS
NameNode和DataNode
Yarn:
ResourceManager和NodeManager
1.将hadoop的压缩包上传到linux中
hadoop压缩包
链接:https://pan.baidu.com/s/1gNVEnV32G7WPBmXfA8wbUw
提取码:iq1j
2.解压hadoop
目录结构
在hadoop目录下运行以下命令删除一些无用文件和目录:
rm -rf bin/*.cmd
rm -rf sbin/*.cmd
rm -rf share/doc/
3.修改环境变量
参考官方文档:http://hadoop.apache.org/docs/r2.7.6/hadoop-project-dist/hadoop-common/SingleCluster.html
可以使用外部工具Notepad++修改比较方便
下载地址:https://notepad-plus-plus.org/ (另一篇博客会详细介绍如何使用notepad++连接linux)