数据块的副本数 | dfs.replication | 3 | 2 | 页面修改 | 减少副本块可以节约存储空间 | |
SequenceFile I/O 缓存区大小 | io.file.buffer.size | 131072(可以更大) | core-site.xml 的群集范围高级配置代码段(安全阀) | hadoop访问文件的IO操作都需要通过代码库,在很多情况下io.file.buffer.size都被用来设置缓存的大小。不论是对硬盘或者是网络操作来讲,较大的缓存都可以提供更高的数据传输,但这也就意味着更大的内存消耗和延迟。这个参数要设置为系统页面大小的倍数,以byte为单位。 | ||
.Trash目录下文件被永久删除前保留的时间 | fs.trash.interval | 1440(24小时) | core-site.xml 的群集范围高级配置代码段(安全阀) | |||
垃圾回收的检查间隔 | fs.trash.checkpoint.interval | 1440 | core-site.xml 的群集范围高级配置代码段(安全阀) | |||
是否启动Hadoop的本地库 | io.native.lib.available | true | core-site.xml 的群集范围高级配置代码段(安全阀) | 本地库可以加快基本操作,例如IO,压缩等。 | ||
NameNode 处理程序计数 | dfs.namenode.handler.count | 40 | 400 | 页面修改 | 设定 namenode server threads 的数量,这些 threads 會用 RPC 跟其他的 datanodes 沟通。当 datanodes 数量太多时会发現很容易出現 RPC timeout,解決方法是提升网络速度或提高这个值,但要注意的是 thread 数量多也表示 namenode 消耗的内存也随着增加。 | 扩展性相关参数 |
NameNode 服务处理程序计数 | dfs.namenode.service.handler.count | 400 | 页面修改 | |||
NameNode的java堆栈大小 | NameNode Java heap size | 90G | 页面修改 | |||
DataNode的java堆栈大小 | DataNode maximum Java heap size | 16G | 页面修改 | |||
DataNode 处理程序计数 | dfs.datanode.handler.count | 3 | 50 | |||
提前读取的字节数 | dfs.datanode.readahead.bytes | 4M | 64M | 页面修改 | 读取块文件时,DataNode 可以使用 posix_fadvise 系统呼叫将数据显式放入操作系统缓冲区缓存中当前读取器位置之前。这样可以提高性能,尤其是在磁盘高度占用的情况下。该配置指定 DataNode 尝试提前读取的位置比当前读取位置提前的字节数。 | |
ipc服务监听队列长度 | ipc.server.listen.queue.size | 1024 | 与系统参数net.core.somaxconn保持一致 | core-site.xml 的群集范围高级配置代码段(安全阀) | 增大打开文件数据和网络连接上限,提高hadoop集群读写速度和网络带宽使用率 |
hdfs中参数的配置
最新推荐文章于 2025-05-18 17:06:01 发布