项目GitHub地址:https://github.com/heibaiying/BigData-Notes ✒️ 前 言 大数据技术栈思维导图 大数据常用软件安装指南 一、Hadoop 分布式文件存储系统——HDFS 分布式计算框架——MapReduce 集群资源管理器——YARN Hadoop单机伪集群环境搭建 Hadoop集群环境搭建 HDFS常用Shell命令 HDFS Java API的使用 基于Zookeeper搭建Hadoop高可用集群 二、Hive Hive简介及核心概念 Linux环境下Hive的安装部署 Hive CLI和Beeline命令行的基本使用 Hive 常用DDL操作 Hive 分区表和分桶表 Hive 视图和索引 Hive常用DML操作