
Hive
chipeize
这个作者很懒,什么都没留下…
展开
-
Hive(数据仓库) Hive 的安装
Hive 的安装这里我们选用hive的版本是2.1.1下载地址为:http://archive.apache.org/dist/hive/hive-2.1.1/apache-hive-2.1.1-bin.tar.gz下载之后,将我们的安装包上传到第三台机器的/export/softwares目录下面去第一步:上传并解压安装包将我们的hive的安装包上传到第三台服务器的/expo...原创 2019-08-26 20:44:48 · 254 阅读 · 0 评论 -
Hive(数据仓库)数据仓库和 Hive 的基本概念
1. 数据仓库1.1 基本概念 英文名称为 Data Warehouse,可简写为 DW 或 DWH。数据仓库的目的是构建面相分析的集成化数据环境,为企业提供决策支持(Decision Support)。 数据仓库是存数据的,企业的各种数据往里面存,主要目的是为了分析有效数据,后续会基于它产出供分析挖掘的数据,或者数据应用需要的数据,如企业的分析性报告和各类报表...原创 2019-08-26 20:41:27 · 2557 阅读 · 0 评论 -
Hive(数据仓库) Hive 的交互方式和基本操作
1. Hive 的交互方式第一种交互方式:bin/hive第二种交互方式:使用 sql 语句或者 sql 脚本进行交互2. Hive 的基本操作2.1 数据库操作创建数据库:create database if not exists myhive;创建数据库并指定位置:create database myhive location '/myhi...原创 2019-09-02 20:16:00 · 421 阅读 · 0 评论 -
Hive(数据仓库)Hive 的查询语法、shell参数、函数
4. Hive 查询语法4.1. SELECTSELECT [ALL | DISTINCT] select_expr, select_expr, ...FROM table_reference[WHERE where_condition][GROUP BY col_list [HAVING condition]][CLUSTER BY col_list| [DISTRIBUTE BY...原创 2019-09-02 20:21:02 · 605 阅读 · 0 评论 -
Hive(数据仓库)数据压缩、数据存储格式
7.hive的数据压缩在实际工作当中,hive当中处理的数据,一般都需要经过压缩,前期我们在学习hadoop的时候,已经配置过hadoop的压缩,我们这里的hive也是一样的可以使用压缩来节省我们的MR处理的网络带宽**7.1 **MR支持的压缩编码压缩格式工具算法文件扩展名是否可切分DEFAULT无DEFAULT.deflate否Gzipgzip...原创 2019-09-02 20:22:55 · 1162 阅读 · 0 评论 -
Hive(数据仓库)Hive 调优
10.hive调优10.1 Fetch抓取Hive中对某些情况的查询可以不必使用MapReduce计算。例如:SELECT * FROM score;在这种情况下,Hive可以简单地读取score对应的存储目录下的文件,然后输出查询结果到控制台。通过设置hive.fetch.task.conversion参数,可以控制查询语句是否走MapReduce.案例实操:1)把hive.fetch....原创 2019-09-02 20:23:36 · 297 阅读 · 0 评论