大数据之Hive简介

最新推荐文章于 2021-11-17 01:24:14 发布

、北冥有鱼

最新推荐文章于 2021-11-17 01:24:14 发布

阅读量462

点赞数

分类专栏：笔记文章标签： hadoop hdfs hive

本文链接：https://blog.youkuaiyun.com/qq_38800259/article/details/108119214

版权

笔记专栏收录该内容

3 篇文章

订阅专栏

Hive基本概念

1.1什么是Hive

1）hive简介

Hive:由facebook开源用于解决海量结构化日志的数据统计工具。

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。

2）Hive本质：将HQL转化成MapReduce程序

（1）Hive处理的数据存储在HDFS

（2）Hive分析数据底层的实现是MapReduce

（3）执行程序运行在Yarn上

1.2Hive的优缺点

1.2.1优点

（1）操作接口采用类SQL语法，提供快速开发的能力（简单，容易上手）。

（2）避免了去写MapReduce,减少开发人员的学习成本。

（3）Hive优秀在于处理大数据，支持海量数据的分析与计算。

（4）Hive支持用户自定义函数，用户可以根据自己的需求来实现自己的函数。

1.2.2缺点

1）Hive的HQL表达能力有限

（1）Hive自动生成的MapReduce作业，通常情况下不够智能化。

（2）数据挖掘方面不擅长，由于MapReduce数据处理流程的限制，效率更高的算法却无法实现。

2）Hive的效率比较低

（1）Hive的执行延迟比较高，因此Hive常用于数据分析，对实时性要求不高的场合。

（2）Hive调优比较困难，粒度较粗。

3）Hive不支持实时查询和行级别更新

（1）hive分析的数据是存储在hdfs上，hdfs不支持随机写，只支持追加写，所以在hive中不能updata和delete，能select和insert.

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

、北冥有鱼

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Hive以及Hive安装部署

望山。

11-15

2155

文章目录1.Hive简介1.1什么是Hive1.2为什么使用Hive1.3Hive的特点1.4Hive架构图1.5Hive与Hadoop的关系1.6Hive与传统数据库对比2.HIVE的安装部署1.derby版hive直接使用1、解压hive2.修改目录名称3.初始化元数据库4.启动5.创建数据库6.创建表7.插入数据8.可能遇到的问题9.Hive启动报错Safe mode2.基于mysql管理元数据版hive1、解压hive2.修改目录名称3.检测服务器mysql数据库4.配置mysql允许外网访问5.退

大数据(九) - Hive

will的成长之路

01-19

5190

构建在Hadoop之上的数据仓库，数据计算使用MR，数据存储使用HDFS 因为数据计算使用mapreduce，因此通常用于进行离线数据处理 Hive 定义了一种类 SQL 查询语言——HQL 类似SQL，但不完全相同可认为是一个HQL-->MR的语言翻译器。简单，容易上手有了Hive，还需要自己写MR程序吗？ Hive的H

参与评论您还未登录，请先登录后发表或查看评论

大数据（017）Hive【Hive介绍】

张--小涛涛

09-12

1894

一、HIVE介绍 HIVE产生的目的：方便非java编程者对hdfs数据进行MapReduce操作 HIVE概念：hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的M

大数据技术之Hive（一）

a376712116的博客

07-14

2209

一、Hive 基本概念 1.1 什么是 Hive 　　Hive：由 Facebook 开源用于解决海量结构化日志的数据统计。　　Hive 是基于 Hadoop 的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类 SQL 查询功能。　　本质是：将 HQL 转化成 MapReduce 程序　　1）Hive 处理的数据存储在 HDFS 　　2）Hive 分析数据底层的实...

大数据之Hive<一>

morexyoung的博客

12-27

736

一 Hive基本概念1.1 什么是HiveHive：由Facebook开源用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。本质是：将HQL转化成MapReduce程序1）Hive处理的数据存储在HDFS2）Hive分析数据底层的实现是MapReduce3）执行程序运行在Yarn上1.2 Hive的优缺点1.

大数据之Hive详解

06-15

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件...本课程从基本概念,hive和mysql软件的安装入手,讲解hive的数据类型,DDL和DML操作,以及常用的查询和函数的使用,让你快速入门hive,即刻成为大数据程序员.

大数据之Hive

06-09

hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句实现简单的...

尚硅谷大数据技术之Hive1

08-04

【尚硅谷大数据技术之Hive1】章节主要介绍了Hive的基本概念、优缺点、架构原理以及与传统数据库的比较。 1. **Hive是什么** Hive是由Facebook开源的一个数据仓库工具，专门用来处理海量的结构化日志数据统计。它...

大数据面试 Hive 八股文

02-20

Hive是大数据领域中一个重要的数据仓库工具，它设计的目标是为大规模数据集提供数据查询和分析能力。由于Hive提供了类似SQL的查询语言（HQL），使得非Java背景的分析师也能轻松进行大数据处理。下面我们将深入探讨...

尚硅谷大数据技术之 Hive1

08-03

【尚硅谷大数据技术之 Hive1】章节主要介绍了Hive的基本概念、优缺点、架构原理以及与数据库的比较。 1. **Hive基本概念** Hive是由Facebook开源的一种数据仓库工具，设计用来处理海量的结构化日志数据统计。它...

大数据技术之Hive（六）

a376712116的博客

07-15

517

九、企业级调优 9.1 Fetch 抓取 Fetch 抓取是指，Hive 中对某些情况的查询可以不必使用 MapReduce 计算。例如： SELECT * FROM employees;在这种情况下，Hive 可以简单地读取 employee 对应的存储目录下的文件，然后输出查询结果到控制台。在 hive-default.xml.template 文件中 hive.fetc...

大数据hive

andy的博客

11-07

1303

Hive：由Facebook开源用于解决海量结构化日志的数据统计工具。 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能 5大数据技术之Hive 版本：V3.0 第1章 Hive基本概念 1.1 什么是Hive 1） hive简介 Hive：由Facebook开源用于解决海量结构化日志的数据统计工具。 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能 2） Hive本质：

大数据-hive

weixin_43204767的博客

11-17

1179

1 hive环境搭建 2hive 安装 2.1 hive交互命令 1） “-e”不进入 hive 的交互窗口执行 sql 语句 [root@hadoop102 hive]# bin/hive -e “select * from test” 2） “-f”执行脚本中 sql 语句 bin/hive -f /opt/module/hive/datas/hivef.sql 主要运用写脚本时候使用的。 3 Hive数据类型 3.1 基本数据类型对于 Hive 的 String 类型相当于数据库的 varchar

大数据时代--Hive技术原理解析

热门推荐

王洋的专栏

01-23

2万+

本文旨在讲解Hive的运行原理，帮助使用者更好的了解在使用的过程中它做了些什么工作，深入的理解他的工作机制，提高开发人员理论层面的知识。后面会逐渐推出Hive使用、Hbase原理与使用等大数据专题类文章，敬请关注。什么是Hive？ Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储

大数据技术之Hive（二）

a376712116的博客

07-14

1151

二 Hive 安装环境准备 2.1 Hive 安装地址 1）Hive 官网地址： http://hive.apache.org/ 2）文档查看地址： https://cwiki.apache.org/confluence/display/Hive/GettingStarted 3）下载地址： http://archive.apache.org/dist/hive/ 4）github...

大数据_Hive

一叶知秋

07-27

162

大数据_Hive数据仓库数据库与数据仓库的区别数仓的分层架构Hive简介架构Hive交互方式基本操作英文名称为Data Warehouse，可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据环境，为企业提供决策支持（Decision Support）。它出于分析性报告和决策支持目的而创建。数据仓库本身并不“生产”任何数据，同时自身也不需要“消费”任何的数据，数据来源于外部，并且开...

大数据开发----Hive（入门篇）

谷震平的专栏

02-02

4875

前言本篇介绍Hive的一些常用知识。要说和网上其他manual的区别，那就是这是笔者写的一套成体系的文档，不是随心所欲而作。本文所用的环境为： CentOS 6.5 64位 Hive 2.1.1 Java 1.8 Hive Architecture引自官网，务必仔细阅读： Figure 1 also shows how a typical query flows through the syst

大数据-hive入门详解

zZsSzss的博客

08-13

539

目录hive概述什么是hive?HQL转换成MR流程hive的优缺点hive的架构 hive概述什么是hive? 维基百科-hive Apache Hive 中文手册 hive是建立在hadoop架构上的数据仓库工具,能够提供数据精炼、查询和分析,能够将结构化的数据文件映射成一张表,并提供类SQL查询功能,底层是将SQL转换成MR程序 HQL转换成MR流程首先hive通过对SQL进行统计分析,将SQL语言中常用的操作用MapReduce写成很多模板,所有的MapReduce模板都封装在hive中

大数据之hive第11章hive实战尚硅谷