HDFS中的读写数据流

最新推荐文章于 2025-01-07 19:16:01 发布

转载最新推荐文章于 2025-01-07 19:16:01 发布 · 122 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：https://my.oschina.net/u/782865/blog/126504

文章标签：

#大数据 #python

2019独角兽企业重金招聘Python工程师标准>>>

1.文件的读取：

首先、客户端铜鼓调用FileSystem对象中的open（）函数读取它需要的数据。FileSystem是HDFS中DistributeFileSystem的一个实例。DistributeFileSystem会通过RPC协议调用NameNode来确定请求文件所在的位置，对于每个返回的块都包换块所在的DataNode地址，随后这些返回的DataNode会按照Hadoop定义的集群拓扑结构得出客户端的距离。然后再进行排序，如果客户端本身就是一个DataNode那么它将从本地读取文件。这里要关注的一个设计要点是，客户端通过NameNode引导获取最合适的DataNode地址，然后直接连接DataNode读取数据。这种设计的好处，这可以使HDFS扩展到更大规模的客户端并行处理。这是因为数据的流动所有的DataNode之间分散进行的，同时NameNode的压力也变小。

2.文件写入

①客户端通过调用DistributeFileSystem对象中的Create（）创建一个文件，通过RPC（）调用在NameNode的文件系统命名空间中创建一个新文件。

②NaneNode会通过多种验证保证新的文件不存在文件系统中，并且确保请求客户端有创建按文件的权限。如果成功distributeFileSystem返回一个FSDataOutputStream给客户端写人数据

③当客户端写入数据时，DFSoutputStream会将文件分割成包，然后放入内部队列，DataStreamer，作用是请求NameNode为新的文件包分配合适的DataNode存放副本。

④DFSoutputStream同时也会保存在一个包的内部队列，用来等待管道中的DataNode返回确认信息。

《hadoop实战第二版》… 机械工业出版社 ….. 陆嘉恒著；

转载于:https://my.oschina.net/u/782865/blog/126504

weixin_33769125

博客等级

码龄10年

172
原创

259
点赞

1572
收藏

6633
粉丝

关注

私信

热门文章

上一篇：: 产生Fibonacci数列

下一篇：: hadoop之Combiner

最新评论

各种气候数据的下载（以下载青岛地区40年间月平均气温数据的下载为例）【转】...
2401_85122388: 羲和要钱吧
更改Windows用户文件夹（Users）默认位置到其它盘
c1300765164: 不建议Win11采用这个方法，除非不准备继续更新。否则，硬链接将导致一些更新失败。可以用Win11自带功能修改存储位置全部默认为D，可以节省一些以往的下载文件。实习不行。向everyting屈服吧
各种气候数据的下载（以下载青岛地区40年间月平均气温数据的下载为例）【转】...
羲和能源气象大数据平台: 推荐一些我常用的气象数据网站：中国气象局 https://www.cma.gov.cn/ 作为全国气象工作的政府行政管理职能，负责全国气象工作，主要履行公共气象服务以及气象防灾减灾、应对气候变化、开发利用气候资源、人工影响天气等业务、服务管理等职能。提供权威气象政务信息、天气预报、气象预警、气候变化、防灾减灾、气象科普等权威官方信息。羲和能源大数据平台 https://xihe-energy.com 提供全球任意单点位置或地域平均统计的历史40年至未来7日的11种气象小时级数据和API接口，及以此为基准生成的风电、光伏发电功率数据。同时还可以提供多种地理信息数据和260余种更多属性数据。通过对数据的处理分析计算，还提供地区新能源资源分析、光伏倾角优化、光伏电站系统方案设计及项目建议书一键生成等功能。 NESDIS http://www.nesdis.noaa.gov/ NEDIS 是美国NOAA国家卫星资料中心，拥有四套卫星系统：GOES，POES，DMSP，NPOESS。其两颗静止卫星在距地球22,450英里处，追踪灾害性天气和太阳活动。450英里处两颗极轨环绕地球，观测大气风场和温度，为运行预报模式准备，此外还观测海温用于气候研究。 NASA https://www.nasa.gov/ 美国航空航天局（英语：National Aeronautics and Space Administration，简称NASA），又称美国宇航局、美国太空总署，是美国联邦政府的一个行政性科研机构，负责制定、实施美国的太空计划，并开展航空科学暨太空科学的研究。NASA是世界上最权威的航空航天科研机构，与许多国内及国际上的科研机构分享其研究数据。欧洲中尺度天气预报中心 http://www.ecmwf.int 包括34个国家支持的国际性组织，是当今全球独树一帜的国际性天气预报研究和业务机构。其前身为欧洲的一个科学与技术合作项目。1975年ECMWF正式成立，总部设在英国的Bracknell。
PC端页面适应不同的分辨率的方法
以对_: 感谢分享，解决了我眼前的疑惑
各种气候数据的下载（以下载青岛地区40年间月平均气温数据的下载为例）【转】...
m0_72640678: 框选之后results 不显示东西怎么回事呢

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。