
Hive
上善若水
每天努力一点,就离大神们近一点。
展开
-
Hive——使用JDBC查询Hive(13)
1、创建Java项目,引入jar包。将/root/training/apache-hive-2.3.0-bin/jdbc 路径下的jar包引入Java项目中。2、编写代码JDBCUtils.javapackage com.hive.demo;import java.sql.*;/** * 工具类 * 1、获取Connection * 2、释放资源 */...原创 2019-11-03 22:34:27 · 1540 阅读 · 0 评论 -
Hive——执行Hive的查询:执行SQL(HQL)(12)
HQL是SQL的一个子集 数学函数:round、ceil、floor字符函数:lower、upper、length、concat、substr、trim、lpad、rpad收集函数:size日期函数:to_date、year、month、day、weekofyear、datediff、date_add、date_sub条件函数:ifcoalescecase... w...原创 2019-10-29 22:30:55 · 758 阅读 · 2 评论 -
Hive——Hive的数据模型_视图(11)
视图(View)(*) 是一个虚(不存数据)表(*) 作用:简化复杂的查询原创 2019-10-29 22:11:43 · 200 阅读 · 0 评论 -
Hive——Hive的数据模型_桶表(10)
桶表:类似Hash分区根据员工的职位job建立桶表。原创 2019-10-29 21:57:16 · 185 阅读 · 0 评论 -
Hive——Hive的数据模型_外部表(9)
外部表只定义表结构,数据保存在HDFS的某个目录下。继续创建 数据 存储在外部,然后再查询外部表。原创 2019-10-29 21:45:07 · 198 阅读 · 0 评论 -
Hive——SQL的执行计划(8)
Oracle中SQL的执行计划查询10号部门的员工explain plan for select * from emp where deptno=10;select * from table(dbms_xplan.display);补充:Oracle数据库的优化器 1、RBO:基于规则的优化器 2、CBO:基本上都是CBO,基于成本的优化器补充:Oracle中的索引...原创 2019-10-28 21:18:45 · 249 阅读 · 0 评论 -
Hive——Hive的数据模型_分区表(7)
Partition Table (分区表)Partition 对应于数据库的 Partition 列的密集索引 在 Hive 中,表中的一个 Partition 对应于表下的一个目录,所有的 Partition 的数据都存储在对应的目录中往分区表中插入数据:在Hive中,通过SQL的执行计划获知分区表提高的效率...原创 2019-10-28 21:11:29 · 228 阅读 · 0 评论 -
Hive——Hive的数据模型_内部表(6)
Hive的数据存储基于HDFS 没有专门的数据存储格式 存储结构主要包括:数据库、文件、表、视图 可以直接加载文本文件(.txt文件) 创建表时,指定Hive数据的列分隔符与行分隔符表Inner Table(内部表)与数据库(MySQL、Oracle)中的 Table 在概念上是类似 默认的列分隔符是:tab键 每一个 Table 在 Hive 中都有一个相应的目录存储数...原创 2019-10-28 20:55:50 · 296 阅读 · 0 评论 -
Hive——Hive的数据类型(5)
基本数据类型tinyint/smallint/int/bigint:整数类型 float/double:浮点数类型 boolean:布尔类型 string:字符串类型复杂数据类型Array:数组类型,由一系列相同数据类型的元素组成 Map:集合类型,包含key--->value键值对,可以通过key来访问元素。 Struct:结构类型,可以包含不同数据类型的元素。这些元素...原创 2019-10-28 20:09:25 · 196 阅读 · 0 评论 -
Hive——本地模式、远程模式(4)
远程模式元数据信息存储在远程的MySQL数据库中 注意一定要使用高版本的MySQL驱动(5.1.43以上的版本)1、创建hive-site.xml<?xml version="1.0" encoding="UTF-8" standalone="no"?><?xml-stylesheet type="text/xsl" href="configuration.x...原创 2019-10-26 20:09:26 · 359 阅读 · 0 评论 -
Hive——安装MySQL数据库(3)
在虚拟机上安装MySQL:1、通过yum命令卸载Linux上自带的MySQL。yum remove mysql-libs2、安装MySQLrpm -ivh mysql-community-common-5.7.19-1.el7.x86_64.rpmrpm -ivh mysql-community-libs-5.7.19-1.el7.x86_64.rpmrpm -ivh mysql...原创 2019-10-26 18:42:05 · 250 阅读 · 0 评论 -
Hive——安装与配置Hive 之 嵌入模式(2)
安装模式:嵌入模式:不需要使用MySQL,使用Hive自带的Derby数据库存储Hive的元信息 本地模式、远程模式:都需要MySQL一、准备工作1、解压 tar -zxvf apache-hive-2.3.0-bin.tar.gz -C ~/training/2、设置环境变量 vi ~/.bash_profileHIVE_HOME=/root/training/apac...原创 2019-10-24 22:10:52 · 1480 阅读 · 0 评论 -
Hive——Hive的介绍与体系架构(1)
一、什么是Hive?构建在Hadoop上的数据仓库平台,为数据仓库管理提供了许多功能 Hive基于Hadoop之上的一个数据分析引擎 Hive是一个翻译器 Hive 2.x 以前:SQL -----> Hive ----> MapReduce Hiv...原创 2019-10-24 20:24:36 · 274 阅读 · 0 评论