【Hive】Hive的基本概念和安装

本文介绍了Hive作为基于Hadoop的数据仓库工具,它允许使用类SQL语法操作数据,简化了MapReduce的编写。Hive的架构包括用户接口、元数据存储、解析器等组件,其元数据通常存储在MySQL中。Hive与Hadoop紧密相关,依赖HDFS存储数据,使用MapReduce进行查询分析。同时,文章对比了Hive与传统数据库的差异,并提供了Hive3.1.2版本的安装指南。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Hive系列学习笔记


1 简介

什么是Hive

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。

其本质是将SQL转转为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,hive可以理解为一个将SQL转换为MapReduce的任务的工具,甚至更进一步可以说hive是一个MapReduce的客户端

为什么使用Hive

  • 采用了类SQL语法操作数据,提供快速开发的能力
  • 避免去写MapReduce,减少了开发人员的学习成本
  • 功能扩展方便

2 Hive的架构

用户接口:包括CLI、JDBC/ODBC、WebGUI,其中CLI为shell命令行,JDBC/ODBC是hive的java实现,webGUI是通过浏览器访问hive

元数据存储:通常存储在关系型数据库如mysql中

解析器(编译器、优化器、执行器)

MapReduce

HDFS、客户端

3 Hive与Hadoop的关系

  • Hive利用HDFS存储数据
  • Hive利用MapReduce查询分析数据

4 Hive与传统数据库的对比

HiveRDBMS
查询语言HQLSQL
数据存储HDFSRaw Device or Local FS
执行MapReduceExcutor
延迟

项目对比:

在这里插入图片描述

5 Hive的安装

选用Hive3.1.2版本,下载路径为:
https://mirrors.bfsu.edu.cn/apache/hive/hive-3.1.2/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

快乐的冲浪码农

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值