
Hive
不清不慎
热爱编程,热爱生活。
展开
-
Hive文件存储格式查询性能的比较
一、Hive的文件存储格式Hive总共支持以下几种文件存储格式:Text FileSequenceFileRCFileAvro FilesORC FilesParquetCustom INPUTFORMAT and OUTPUTFORMAT这里,我们主要比较Text File,ORC File,Parquet文件存储格式的查询性能,在比较之前,我们先简单介绍一下这三种文件...原创 2018-04-09 21:50:37 · 3635 阅读 · 0 评论 -
Hive安装部署以及初步使用
一、Hive概述HIve是什么?为什么要使用hive?对于一个初步接触hive的初学者,这些都是迷惑的,因此本文主要带你入门hive,让你了解到hive的安装使用以及在hive在大数据中的位置。1.为什么要使用hive?在了解hive之前,相信大家都使用过mapreduce以及hdfs,提及mapreduce我们都会想到对于一些数据的处理总是要自己去编写mapreduce程序去处理...原创 2018-04-03 21:44:11 · 777 阅读 · 0 评论 -
Hive调优总结
熟悉Hive的开发者都知道,Hive会将操作语句转换为MapReduce作业,对于开发者是透明的,我们并不需要理解其原理就可以专注手头的工作,但是在实际开发当中数据量巨大,我们需要采取一些优化措施来提高MR作业的效率。1.执行计划与关系型数据库一样,我们可以使用EXPLAIN命令来分析HQL语句的执行流程,这也是分析一条SQL语句的瓶颈与性能不可缺少的一个步骤。对于Hive的有些HQL语...原创 2019-05-05 18:40:59 · 15410 阅读 · 2 评论 -
Hive权威指南学习笔记
原文链接:Hive权威指南学习笔记原创 2019-07-20 14:33:20 · 362 阅读 · 0 评论