什么是Hadoop?
适合海量数据进行分布式存储和分布式计算的平台
它有三大组件
Hdfs:分布式存储
主节点NameNode:接受客户端读写请求,维护文件系统目录结构 存储元数据信息
从节点DataNode:真实的存储数据
MapReduce:依赖于磁盘IO的批处理计算模型
Yarn:资源调度框架
主节点ResourceManager:整个集群资源的管理者
从节点:NodeManager单个节点的资源管理者
了解完了Hadoop以及VMWare的安装教程?请关注靓仔,一起学习大数据吧!
请点击下方链接查看
本文将深入解析Hadoop的核心组件HDFS、MapReduce及YARN,介绍如何在VMware上安装CenOS7进行Hadoop环境搭建,适合大数据初学者和开发者阅读。
1134

被折叠的 条评论
为什么被折叠?



