阅读之前看这里👉:博主是正在学习数据分析的一员,博客记录的是在学习过程中一些总结,也希望和大家一起进步,在记录之时,未免存在很多疏漏和不全,如有问题,还请私聊博主指正。
博客地址:天阑之蓝的博客,学习过程中不免有困难和迷茫,希望大家都能在这学习的过程中肯定自己,超越自己,最终创造自己。
Hadoop简介
Hive是基于Hadoop的数据仓库管理工具,可以将结构化的数据文件映射为一个数据库表,并提供SQL查询功能,这种查询功能就是Hive SQL
Hadoop是现在各大公司用得比较多的一种数据存储和计算架构系统,由Apache基金会开发,它可以使用户在不了解分布式底层细节的情况下开发分布式程序,充分利用集群的威力进行高速计算和存储。
特点:Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点
Hadoop主要解决了两大问题:
大数据存储和大数据分析。这两个问题的解决分布依赖HDFS和MapReduce。
-
HDFS