hadoop_随笔二_参数

本文详细介绍了Hadoop系统中关键配置参数的作用与优化建议,包括datanode上用于处理RPC的线程数、HTTPserver上的线程数、文件副本数、数据block大小及mapreduce中间结果存储路径等,为Hadoop集群的性能调优提供了实用指南。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1) dfs.datanode.handler.count :

datanode上用于处理RPC的线程数。默认为3,较大集群,可适当调大些,比如8。需要注意的是,每添加一个线程,需要的内存增加。

2)tasktracker.http.threads:

HTTP server上的线程数。运行在每个TaskTracker上,用于处理map task输出。大集群,可以将其设为40~50

 

3)dfs.replication :

文件副本数,通常设为3,不推荐修改

 

4)dfs.block.size

HDFS中数据block大小,默认为64M

 

5)mapred.local.dir

运行 mapreduce 中间结果存储处 

 

转载于:https://www.cnblogs.com/xiaoliwm/p/10119483.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值