
Hive
MySQL技术
MySQL Oracle数据库学习者
个人博客:
https://www.cnblogs.com/mysqljs/
欢迎关注个人公众号:
MySQL技术
展开
-
20180604早课记录24-Hive
1. hive数据分为哪两块?分别存储在哪?元数据和数据本身; mysql等关系型数据库 和 hdfs2. hive的建表SQL语句你们觉得里有哪些内容?(不光光是字段的定义)定义分区,分隔字符,内外表之分3. 默认的换行符和分割符是什么?/t /r4. 加载数据或本地数据到hive表或者覆盖hive表,语法是什么?LOAD DATA LOCAL INP...原创 2018-06-07 14:05:14 · 144 阅读 · 0 评论 -
20180607早课记录26-Hive
1.hive哪些sql会触发mr job带聚合函数,某些insert,还有create table as select2.create table t as select …这样的SQL会不会创建mrjob会3.hive的数据分为哪两块 分别存储哪里元数据和真实数据,分别存储在mysql,hdfs中4.一般工作中,udf编写是很多的,那么怎样临时生效,永久生效?...原创 2018-06-07 14:06:20 · 113 阅读 · 0 评论 -
结构化,半结构化,非结构化数据总结
前言: * Hive可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。在学习Hive之前 我们先了解下结构化数据,半结构化数据以及非结构化数据的区别。1.结构化数据结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。举一个例子:id name ...原创 2018-06-01 16:50:48 · 1023 阅读 · 0 评论 -
Hive分区表简介
简介: 如果一个表中数据很多,我们查询时就很慢,耗费大量时间,如果要查询其中部分数据该怎么办呢,这时我们引入分区的概念。 Hive中的分区表分为两种:静态分区和动态分区。1.静态分区:可以根据PARTITIONED BY创建分区表,一个表可以拥有一个或者多个分区,每个分区以文件夹的形式单独存在表文件夹的目录下。分区是以字段的形式在表结构中存在,通过describe table命...原创 2018-07-02 14:31:19 · 370 阅读 · 0 评论 -
Hive内部函数简介及查询语法
1.Hive内置函数:在Hive中 系统给我们内置了很多函数 具体参考官方地址看下官网给我们的介绍:SHOW FUNCTIONS; --查看所有内置函数DESCRIBE FUNCTION <function_name>; --查看某个函数的描述DESCRIBE FUNCTION EXTENDED <function_name>; --查看某个函数的具体使...原创 2018-07-03 15:43:24 · 577 阅读 · 0 评论 -
Hive基础sql语法(DML)
DML操作(Data Manipulation Language)参考官方文档: DML文档因update和delete在Hive中一般用不到,本篇文章不做讲解。本文主要介绍Load和insert操作。1. LOAD(加载数据)LOAD作用是加载文件到表中(Loading files into tables) * 下面是官网上为我们列出的语法:LOAD DATA...原创 2018-06-24 15:55:32 · 359 阅读 · 0 评论 -
Hive基础sql语法(DDL)
前言:经过前面的学习 我们了解到Hive可以使用关系型数据库来存储元数据,而且Hive提供了比较完整的SQL功能 ,这篇文章主要介绍Hive基本的sql语法。首先了解下Hive的数据存储结构,抽象图如下: * 1.Database:Hive中包含了多个数据库,默认的数据库为default,对应于HDFS目录是/user/hadoop/hive/warehouse,可以通过hive...原创 2018-06-16 20:10:14 · 898 阅读 · 0 评论