hadoop3.2.1使用笔记

博客介绍了 Hadoop 3.2.1 版本的相关配置变化。在 hadoop/etc/hadoop/目录下,slaves 更名为 workers;可视化页面端口从 50070 改为 9870,辅助名称节点端口改为 9868。还提及了 hadoop 格式化命令及启动命令。

在hadoop/etc/hadoop/目录下找不到slaves,因为3.2.1版本更名为workers
http://s100:50070/可视化页面打不开,因为端口更改为9870
辅助名称节点端口更改为9868

hadoop格式化
hadoop namenode -format
启动hadoop
start-all.sh

Hadoop 3.2.1是一个开源的分布式计算框架,主要用于处理大规模数据集。Hadoop的核心组件包括HDFSHadoop Distributed File System)和MapReduce。HDFS负责存储数据,而MapReduce负责处理数据。以下是Hadoop 3.2.1的一些关键特性和文件: ### 关键特性 1. **更高的存储效率**:Hadoop 3.2.1引入了纠删码(Erasure Coding),可以显著减少存储开销。 2. **改进的YARN**:YARN(Yet Another Resource Negotiator)在3.2.1版本中得到了改进,支持更多的资源类型和更好的资源管理。 3. **增强的安全性**:引入了更多的安全功能,如数据加密和更细粒度的访问控制。 4. **更好的兼容性和支持**:支持更多的数据源和更广泛的生态系统工具。 ### 重要文件 1. **hadoop-common-3.2.1.jar**:包含Hadoop的公共类库,提供基础功能。 2. **hadoop-hdfs-3.2.1.jar**:包含HDFS的实现,负责分布式文件系统的操作。 3. **hadoop-mapreduce-client-core-3.2.1.jar**:包含MapReduce的核心实现,负责数据处理任务。 4. **hadoop-yarn-common-3.2.1.jar**:包含YARN的公共类库,负责资源管理和任务调度。 5. **core-site.xml**:配置文件,包含Hadoop的核心配置参数。 6. **hdfs-site.xml**:配置文件,包含HDFS的配置参数。 7. **mapred-site.xml**:配置文件,包含MapReduce的配置参数。 8. **yarn-site.xml**:配置文件,包含YARN的配置参数。 ### 安装和配置 1. **下载Hadoop**:从Apache Hadoop官方网站下载Hadoop 3.2.1的二进制包。 2. **解压文件**:将下载的压缩包解压到目标目录。 3. **配置环境变量**:设置HADOOP_HOME环境变量,并将其bin目录添加到PATH中。 4. **配置XML文件**:根据需要修改core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml文件。 5. **启动Hadoop**:使用start-dfs.sh和start-yarn.sh脚本启动HDFS和YARN。 通过这些步骤,你可以安装和配置Hadoop 3.2.1,并开始处理大规模数据集。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值