Hive基础学习2017-09-17

本文介绍了Hive数据仓库工具的基本概念及其与HBase的主要区别。Hive作为一个建立在Hadoop之上的批处理系统,通过HQL简化了MapReduce任务的编写工作。与之相比,HBase则提供实时数据读写能力,适用于需要快速响应的应用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、Hive介绍:

1、 基于Hadoop的一个数据仓库工具

2、 Hive将HQL语句转译成MapReduceJob

3、 Hive的表其实就是

二、Hive作用

Hive降低了数据人员使用MR的门槛,使得分布式计算通过类SQL的操作即可实现,对大数据应用发展起到了很多的推动作用。

三、Hive特点

1、 使用HQL作为查询接口

2、 使用HDFS作为底层存储

3、 可扩展到100PB+

4、 统一的元数据管理

HQL和SQL的区别:

一、Hive与HBase对比

共同点:

1、 HBase与Hive都架构在Hadoop之上,都是用hdfs作为底层存储

2、 职能上都能对外提供表形式的数据查询等服务

区别:

1、 Hive是建立在Hadoop之上为了减少MapReducejobs编写工作的批处理系统,HBase是为了支持弥补Hadoop对实时操作的缺陷的项目

2、 Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce,Hive中的表是纯逻辑表,是对hdfs文件的一种记录方式。

3、 HBase是物理表,不是逻辑表,提供一个超大的内存hash表,搜索引擎通过它来存储索引,方便查询操作。

二、Hive的数据类型

1、 基本数据类型

tinyint/smallint/int/bigint

float/double

Boolean

String

2、 复杂数据类型

Array/Map/Struct—>结构体

3、 没有SQL中的date/datetime


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值