18、Hive数据库:功能特性与操作指南

Hive数据库:功能特性与操作指南

1. Hive概述

Hive并非传统意义上的数据库,它具有极高的灵活性。与关系型数据库需在摄入数据前定义表结构并仅接收符合该规范的数据不同,Hive可根据已有的数据来定义模式,而非基于可能错误的假设。尽管可变的数据格式无论采用何种技术处理都较为棘手,但Hive模型在处理此类问题时提供了更大的自由度。

2. Hive架构

在Hive 2版本之前,Hadoop主要是一个批处理系统。MapReduce作业通常具有较高的延迟和开销,Hive内部将HiveQL语句编译成MapReduce作业,因此传统的Hive查询也存在高延迟问题。不过,随着Stinger计划以及Hive 0.13版本的改进,这一情况得到了改善。

Hive作为客户端应用程序运行,它处理HiveQL查询,将其转换为MapReduce作业,并将这些作业提交到Hadoop集群。在Hadoop 1中提交到原生MapReduce,在Hadoop 2中提交到运行在YARN上的MapReduce应用程序主节点。

Hive使用一个名为元数据存储(metastore)的组件来存储系统中定义的所有表的元数据,而这些元数据实际上存储在一个专门为Hive使用的关系型数据库中。早期版本的Hive中,所有客户端直接与元数据存储通信,但这要求每个使用Hive CLI工具的用户都知道元数据存储的用户名和密码。

为了解决这个问题,HiveServer应运而生,它作为远程客户端的入口点,同时也作为单一的访问控制点,控制对底层元数据存储的所有访问。不过,由于HiveServer存在一些限制,现在访问Hive的最新方式是通过多客户端的HiveServer2。HiveServe

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值