修改hdfs-site.xml配置文件

本文详细介绍了Hadoop集群配置过程中的五个主要配置文件,包括hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml及yarn-site.xml,并重点解析了hdfs-site.xml中的关键参数设置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

配置Hadoop的主要5个文件

序号配置文件名配置对象主要内容
1hadoop-env.shhadoop运行环境用来定义hadoop运行环境相关的配置信息
2core-site.xml集群全局参数用于定义系统级别的参数,如HDFS URL 、Hadoop的临时目录等
3hdfs-site.xmlHDFS如名称节点和数据节点的存放位置、文件副本的个数、文件的读取权限等
4mapred-site.xmlMapreduce参数包括JobHistory Server 和应用程序参数两部分,如reduce任务的默认个数、任务所能够使用内存的默认上下限等
5yarn-site.xml集群资源管理系统参数配置ResourceManager ,nodeManager的通信端口,web监控端口等

hdfs-site.xml最重要的参数及其解释如下:

No.参数名默认值参数解释
1dfs.namenode.secondary.http-address0.0.0.0:50090定义HDFS对应的HTTP服务器地址和端口
2dfs.namenode.name,dirfile://${hadoop.tmp.dir}/dfs/name定义DFS的名称节点在本地文件系统的位置
3dfs.datanode.data.dirfile://${hadoop.tmp.dir}/dfs/data定义DFS数据节点存储数据块时存储在本地文件系统的位置
4dfs.replication3缺省的块复制数量
5dfs.webhdfs.enabledtrue是否通过http协议读取hdfs文件,如果选是,则集群安全性较差

  本小节修改dfs.replication参数为例
在这里插入图片描述

第一步:

  修改前
在这里插入图片描述
  修改后
在这里插入图片描述
  dfs.replication是数据需要备份的数量,默认是3,如果此数大于集群的机器数会出错。

第二步:

  保存退出

进阶

  通过hadoop官方网址查询core-site.xml 配置信息,可以了解最新的全部的core-site.xml 配置信息,而且包括一些过时的定义标识,从而更好地维护您的集群。

快速链接

上一篇汇总目录下一篇
5.2.2 修改core-site.xml配置文件(二) 云计算数据平台-hadoop集群    5.2.4 修改mapred-site.xml配置文件 (四)
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值