文章目录 一、Hadoop是什么 二、Hadoop生态系统图 三、Hadoop生态圈常用组件 (一)Hadoop (二)HDFS (三)MapReduce (四)Hive (五)Hbase (六)ZooKeeper (七)Sqoop (八)Pig (九)Mahout (十)Flume (十一)Oozie (十二)Hue (十三)Nutch (十四)Avro (十五)Phoenix (十六)Storm (十七)Flink (十八)Spark (十九)YARN (二十)Kafka 一、Hadoop是什么 官网网址:https://hadoop.apache.org/ 大数据学习笔记:初探大数据世界 二、Hadoop生态系统图 三、Hadoop生态圈常用组件 (一)Hadoop Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。Hadoop的核心是HDFS和Mapreduce,hadoop2.0还包括YARN。