
hive
文章平均质量分 96
盛装吾步
这个作者很懒,什么都没留下…
展开
-
Hive基本架构和原理
Hive基本架构和原理转载 2023-02-23 10:59:16 · 2930 阅读 · 0 评论 -
Hive几种数据导入方式
一、从本地文件系统中导入数据到Hive表先在Hive里面创建好表,如下: hive> create table wyp > (id int, name string, > age int, tel string) > ROW FORMAT DELIMITED > FIELDS TERMINATED BY '\t' ...原创 2018-10-23 17:43:45 · 682 阅读 · 0 评论 -
Hive和关系型数据库的区别
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射成一张表,并提供类sql语句的查询功能;Hive使用Hql作为查询接口,使用HDFS存储,使用mapreduce计算;Hive是非关系型数据库即NoSQL(Not Only SQL)。关系数据库,是建立在关系模型基础上的数据库,一个关系型数据库就是由二维表及其之间的联系组成的一个数据组织。1. 查询语言。由于 SQL 被广泛的...原创 2018-03-05 11:10:34 · 6104 阅读 · 0 评论 -
Java API实现向Hive批量导入数据
Java程序中产生的数据,如果导入oracle或者mysql库,可以通过jdbc连接insert批量操作完成,但是当前版本的hive并不支持批量insert操作,因为需要先将结果数据写入hdfs文件,然后插入Hive表中。package com.enn.idcard;import java.io.IOException;import java.sql.Connection;import原创 2017-12-27 18:24:39 · 20395 阅读 · 3 评论 -
HiveServer2服务端配置与启动
在之前的学习和实践Hive中,使用的都是CLI或者hive –e的方式,该方式仅允许使用HiveQL执行查询、更新等操作,并且该方式比较笨拙单一。幸好Hive提供了轻客户端的实现,通过HiveServer或者HiveServer2,客户端可以在不启动CLI的情况下对Hive中的数据进行操作,两者都允许远程客户端使用多种编程语言如Java、Python向Hive提交请求,取回结果。H...原创 2017-12-15 18:33:11 · 16505 阅读 · 0 评论 -
hive2.0单机、伪分布搭建
1. 所需要的环境Hive 2.0需要以下运行环境: Java 1.7以上(强烈建议使用Java 1.8) Hadoop 2.X2. 下载、解压Hive安装包Hive官网地址: http://hive.apache.org/ 例如:wget "http://mirrors.cnnic.cn/apache/hive/hive-2.0.0/apache-hive原创 2017-12-05 11:43:28 · 1148 阅读 · 0 评论 -
Hive官方文档-Hive Tutorial
Hive TutorialHive TutorialConcepts What Is HiveWhat Hive Is NOTGetting StartedData UnitsType SystemBuilt In Operators and FunctionsLanguage CapabilitiesUsage and Examples Creating, Showi翻译 2017-12-22 11:24:56 · 1608 阅读 · 0 评论 -
hive元数据库配置metadata
一、什么是hive元数据?hive元数据就是hive的一些基本的元素,主要包括hive表的基本属性,如下(1)hive表的数据库名、表名、字段名称与类型、分区字段与类型(2)表的分区,分区的属性location等(3)serdeproperties, tblproperties等等可以通过desc formatted tablename查看表原创 2017-12-05 18:44:56 · 8640 阅读 · 0 评论 -
Hadoop Hive sql语法详解
Hadoop知识库 Hive 是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL去查询分析需要的内容,这套SQL简称Hive SQL,使不熟悉map转载 2016-08-18 09:39:03 · 1456 阅读 · 0 评论 -
Hive简介
1.Hive简介2.Hive Sql3.Hive的三种Join方式4.Hive事务使用建议5.Hive 窗口函数、分析函数6.hive与hbase的区别与联系1.Hive简介Hive是一种建立在Hadoop文件系统上的数据仓库架构,并对存储在HDFS中的数据进行分析和管理。提供以下功能:(1)它提供了一系列的工具,可用来对数据进行提取/转化/加载(E原创 2017-09-30 14:07:40 · 1041 阅读 · 0 评论 -
Hive系列之SerDe
SerDe是Serialize/Deserilize的简称,目的是用于序列化和反序列化。序列化作用序列化是对象转换为字节序列的过程。反序列化是字节序列恢复为对象的过程。对象的序列化主要有两种用途:对象的持久化,即把对象转换成字节序列后保存到文件中;对象数据的网络传送。除了上面两点, hive的序列化的作用还包括:Hive的反序列化是对key/value反序列化成hive table的每个转载 2017-11-03 10:45:40 · 11995 阅读 · 0 评论 -
HIVE 数据类型转换
Hive内置数据类型由基本数据类型和复杂数据类型组成。今天的话题是Hive数据类型之间的转换。同Java语言一样,Hive也包括 隐式转换(implicit conversions)和显式转换(explicitly conversions)。 Hive在需要的时候将会对numeric类型的数据进行隐式转换。比如我们对两个不同数据类型的数字进行比较,假如一个数据类型是INT型,另一个 是SMA原创 2017-11-07 14:02:15 · 5865 阅读 · 0 评论