Hive-框架讲解

一、Apache Hive 介绍

  • Hive是一款建立在Hadoop之上的开源数据仓库系统。
  • Hive可以将存储在Hadoop文件中的结构化、半结构化数据文件映射为一张数据库表,基于表提供了一种类似SQL的查询模型,称为Hive查询语言(HQL),用于访问和分析存储在Hadoop文件中的大型数据集。
  • Hive核心是将HQL转换为MapReduce程序,然后将程序提交到Hadoop群集执行。

二、Apache Hive 架构

在这里插入图片描述

1、用户接口

接口介绍
CLICLI(command line interface)为shell命令行,通过命令行访问。
JDBC/ODBCHive中的Thrift服务器允许外部客户端通过网络与Hive进行交互,类似于JDBC或ODBC协议。
WebGUIWebGUI是通过浏览器访问Hive。

2、元数据存储

  • 元数据(Metadata),描述数据的数据,主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。通常是存储在关系数据库如 mysql or derby中。Hive 中的元数据包括表的名字,表的列和分区及其属性,表的属性否为外部表等,表的数据所在目录等。
  • 元数据服务(Metastore),Metastore服务的作用是管理metadata元数据,对外暴露服务地址,让各种客户端通
    过连接metastore服务,由metastore再去连接MySQL数据库来存取元数据。
(1)Hive Metastore 架构图
(2)metastore 配置模式
模式内嵌模式本地模式远程模式【推荐企业使用】
Metastore服务是否需要单独配置、单独启动?
Metadata存储介质DerbyMysqlMysql

3、Driver驱动程序

Driver驱动程序,包括语法解析器、计划编译器、优化器、执行器,完成 HQL 查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在 HDFS 中,并在随后有执行引擎调用执行。
在这里插入图片描述

4、执行引擎

Hive本身并不直接处理数据文件。而是通过执行引擎处理。当下Hive支持MapReduce、Tez、Spark3种执行引擎。
在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值