Hadoop开源软件,可靠的、分布式、可伸缩的。
存储容量单位全称及译音
mega, [兆],M
giga, [吉]咖, G
tera, [太]拉, T
peta, [拍]它, P
exa, [艾]可萨, E
zetta, [泽]它, Z
yotta, [尧]它, Y
大数据带来的便利
存储:分布式存储
计算:分布式计算
云计算[阿里云,腾讯云]
1.服务
2.虚拟化
Hadoop 四 ' V '
volume; variety;velocity;value
Hadoop 的端口
50070 ----> http port namenode
50075 -----> http port datanode
50090 -----> http port secondaryNamenode
50010 -----> rpc port namenode
8020 -----> rpc port datanode
四大模块
common ------>公共模块
hdfs ------>namenode,dataname,secondaryNamenode
mapred ------->framework 框架
yarn ------->resourceManager,nodeManager

本文深入探讨Hadoop作为开源大数据处理框架的核心特性,包括其分布式存储与计算能力,介绍了Hadoop的四大模块:common、hdfs、mapred和yarn,以及其在云计算领域的应用。同时,文章提供了Hadoop系统中关键端口的详细信息,为读者理解Hadoop的工作原理和技术细节提供了全面的视角。


被折叠的 条评论
为什么被折叠?



