HDFS读写文件流程

文件写入HDFS

1、整体过程:
客户端要向HDFS写数据,首先要跟namenode通信以确认可以写文件并获得接收文件block的datanode,然后,客户端按顺序将文件分割为若干个block,传递给相应datanode,并由接收到block的datanode负责向其他datanode复制block的副本
2、详细步骤:
在这里插入图片描述
1、client向namenode通信请求上传文件,namenode检查目标文件是否已存在,父目录是否存在
2、namenode返回是否可以上传
3、client会先对文件进行切分,比如设置一个block块128M,文件有300M就会被切分成3个块,一个128M、一个128M、一个44M,然后client向namenode请求第一个 block该传输到哪些datanode服务器上
4、namenode返回datanode服务器的地址
5、client请求datanode上传数据(本质上是一个RPC调用,建立pipeline管线),第一个datanode收到请求会继续调用第二个datanode,然后第二个调用第三个datanode,将整个pipeline建立完成,逐级应答客户端(此处副本设置为3)
6、client开始往第一个datanode上传第一个block(先从磁盘读取数据放到一个本地内存缓存),以packet为单位(一个packet为64kb)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值