1 大数据技术简介
1.1 大数据






1.2 Hadoop(两件事:海量数据存储和计算)





1.3 Hadoop和Hive、Spark的区别

1.4 Hadoop的3部分组成



1.4.1 HDFS架构3部分(目录-数据-备份)

这篇博客介绍了Hadoop的基础知识,包括大数据概述、Hadoop的主要功能——海量数据存储和计算,并对比了Hadoop与Hive、Spark的区别。文章详细阐述了Hadoop的三个组成部分:HDFS、YARN和MapReduce的工作机制。同时,讲解了在Windows上安装Hadoop的步骤。对于HDFS,强调了其操作类似于MySQL,并详述了其特点、组成、读写数据过程以及DataNode的工作流程。MapReduce部分则深入解析了执行原理、MapReduce任务的分类,以及通过WordCount案例说明MapReduce的实现。最后,简单介绍了YARN作为资源调度平台的角色。
















1万+
722

被折叠的 条评论
为什么被折叠?