
hive
文章平均质量分 90
C_FuL
这个作者很懒,什么都没留下…
展开
-
Hive体系架构
Hive 是什么首先是一个构建在Hadoop之上的数据仓库(它并不是一个真实的数据库)由Facebook开源,最初用于解决海量结构化的日志数据统计问题 Hive定义了一种类似于SQL查询语言:HQL(非常类似于MySQL中的SQL语句,同时做了扩展) 通常用于离线数据处理(采用MapReduce) 可以认为是一个HQL=>MapReduce的语言翻译器 底层支持多种不同的执行引擎(默认是原创 2017-08-24 14:19:54 · 601 阅读 · 0 评论 -
Hive环境搭建
前言: 首先Hive中的元数据默认存放在Derby中,Derby是单用户的,使用起来不方便,我们使用MySQL来存储Hive的元数据信息,元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。 由于Hive的元数据需要不断的更新、修改,而HDFS系统中的文件是多读少改的,这显然不能将Hive的元数据存储在HDFS中。安装mysql直接使用yum安装mysql是无原创 2017-08-24 15:15:34 · 522 阅读 · 0 评论