Hadoop【理论篇】04：SecondaryNameNode以及DataNode介绍

做一个有趣的人Zz

已于 2025-06-10 08:50:27 修改

阅读量1k

点赞数

CC 4.0 BY-SA版权

分类专栏：大数据工程师的成长之路 Hadoop 文章标签： hdfs hadoop mr

于 2022-03-02 08:01:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_40612128/article/details/123221048

大数据工程师的成长之路同时被 2 个专栏收录

136 篇文章 ¥69.90 ¥99.00

订阅专栏

28 篇文章

订阅专栏

本文详细介绍了Hadoop集群中的SecondaryNameNode和DataNode。SecondaryNameNode主要负责周期性合并edits文件到fsimage，执行checkpoint操作。在HA架构中，此功能由standby NameNode承担。DataNode作为数据存储节点，管理block和replication。HDFS的Block是读写数据的基本单位，DataNode根据dfs.datanode.data.dir配置存储数据。默认情况下，每个文件至少有一个副本，副本数可通过dfs.replication配置。NameNode则维护文件到block及block到DataNode的映射关系。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、SecondaryNameNode介绍

刚才在分析edits日志文件的时候我们已经针对SecondaryNameNode做了介绍，在这里再做一个总结，以示重视。

SecondaryNameNode主要负责定期的把edits文件中的内容合并到fsimage中

这个合并操作称为checkpoint，在合并的时候会对edits中的内容进行转换，生成新的内容保存到fsimage文件中。

注意：在NameNode的HA架构中没有SecondaryNameNode进程，文件合并操作会由standby NameNode负责实现

所以在Hadoop集群中，SecondaryNameNode进程并不是必须的。

二、DataNode介绍

DataNode是提供真实文件数据的存储服务

针对datanode主要掌握两个概念，一个是block，一个是replication

首先是block

HDFS会按照固定的大小，顺序对文件进行划分并编号，划分好的每一个块称一个Block，HDFS默认Block大小是 128MB

Blokc块是HDFS读写数据的基本单位，不管你的文件是文本文件还是视频或者音频文件，针对hdfs而言都是字节。

我们之前上传的一个user.txt文件，他的block信息可以在fsimage文件中看到，也可以在hdfs webui上面看到, 里面有block的id信息,并且也会显示这个数据在哪个节点上面

了解本专栏

做一个有趣的人Zz

博客等级

码龄8年

759
原创

4193
点赞

4894
收藏

3225
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: Hadoop【理论篇】03：HDFS体系结构以及NameNode介绍

下一篇：: Hadoop【理论篇】05：HDFS回收站和安全模式介绍

最新评论

Docker【项目篇】03：打包部署前端项目
Orion0504: 突然明白了，是写nginx的vip对的，因为负载均衡后端服务了所以直接调用后端api，就变成了nginx的ip+nginx负载均衡配置的port，又因为用了nginx+keepalived高可用，所以直接写nginx的vip+nginx负载配置的port
MySQL【高可用篇】03：MySQL8.0.25InnoDB Cluster【MGR】集群搭建部署
做一个有趣的人Zz: 数据库安装包是下载ubuntu版本的安装包吗
MySQL【高可用篇】03：MySQL8.0.25InnoDB Cluster【MGR】集群搭建部署
ATpeng: 唯一的区别就是我用的Ubuntu22.04 ，配置完到数据库重启的那一步，起不来。[code=plain] Jul 31 17:32:21 mysql03 systemd[1]: mysql.server.service: Found left-over process 3890725 (mysqld_safe) in control group while starting unit. Ignoring. Jul 31 17:32:21 mysql03 systemd[1]: This usually indicates unclean termination of a previous run, or service implementation deficiencies. Jul 31 17:32:21 mysql03 systemd[1]: mysql.server.service: Found left-over process 3891985 (mysqld) in control group while starting unit. Ignoring. Jul 31 17:32:21 mysql03 systemd[1]: This usually indicates unclean termination of a previous run, or service implementation deficiencies. Jul 31 17:32:21 mysql03 systemd[1]: Starting LSB: start and stop MySQL... [/code]
MySQL【高可用篇】03：MySQL8.0.25InnoDB Cluster【MGR】集群搭建部署
ATpeng: 唯一的差别就是我用的Ubuntu22.04，在配置完所有的参数后，重启的那一步，重启失败。[code=plain] ░░ The unit mysql.server.service completed and consumed the indicated resources. Jul 31 17:32:21 mysql03 systemd[1]: mysql.server.service: Found left-over process 3890725 (mysqld_safe) in control group while starting unit. Ignoring. Jul 31 17:32:21 mysql03 systemd[1]: This usually indicates unclean termination of a previous run, or service implementation deficiencies. Jul 31 17:32:21 mysql03 systemd[1]: mysql.server.service: Found left-over process 3891985 (mysqld) in control group while starting unit. Ignoring. Jul 31 17:32:21 mysql03 systemd[1]: This usually indicates unclean termination of a previous run, or service implementation deficiencies. Jul 31 17:32:21 mysql03 systemd[1]: Starting LSB: start and stop MySQL... ░░ Subject: A start job for unit mysql.server.service has begun execution ░░ Defined-By: systemd ░░ Support: http://www.ubuntu.com/support ░░ ░░ A start job for unit mysql.server.service has begun execut [/code]
Zabbix【安装篇】03：CentOS 9 操作系统【手动】安装部署Zabbix 7.0
网安小陈（小白）: 大佬请问一下，前面的完全跟你一样，就最后一步替换字体有问题，替换之后全部字都看不见了，在转圈，可能是啥原因啊

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

做一个有趣的人Zz 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。