
hive
文章平均质量分 60
JZ_Kaka
这个作者很懒,什么都没留下…
展开
-
Hive使用杂记
一、环境描述1、Hadoop版本0.20.2,操作系统Linux、JDK 1.62、Hive版本0.5.0二、元数据的存储1、如果之前进行了建表操作,但是后来对hdfs format后,通过Hive的cli来输入指令show tables查看表,表结构依然存在,但是hdfs文件系统中对应的目录却不存在。那是因为hive的元数据还存在原因导致。元数据默认存放在metastore_db中,删除这个文件...原创 2010-10-27 09:47:11 · 170 阅读 · 0 评论 -
Hive安装手册
一、安装准备1、下载hive-0.5.0-bin版本:http://apache.etoak.com/hadoop/hive/hive-0.5.0/2、JDK版本:jdk-6u20-linux-i586.bin 3、操作系统:Linux s132 2.6.9-78.8AXS2smp #1 SMP Tue Dec 16 02:42:55 EST 2008 x86_64 x86_64 x86_64 G...原创 2010-10-27 09:47:54 · 163 阅读 · 0 评论 -
Hive的JDBC连接
一、环境Hadoop 0.20.2版本、Hive-0.5.0版本、JDK1.6二、使用目的1、一般来说我们对hive的操作都是通过cli来进行,也就是Linux的控制台,但是,这样做本质上是每个连接都存放一个元数据,各个之间都不相同,所以,对于这样的模式我建议是用来做一些测试比较合适,并不适合做产品的开发和应用。2、因此,就产生的JDBC连接的方式,当然还有其他的连接方式,比如ODBC等。三、连接...原创 2010-10-27 09:48:19 · 210 阅读 · 0 评论 -
Hive-0.5中UDF和UDAF简述
一、UDF1、背景:Hive是基于Hadoop中的MapReduce,提供HQL查询的数据仓库。Hive是一个很开放的系统,很多内容都支持用户定制,包括:a)文件格式:Text File,Sequence Fileb)内存中的数据格式: Java Integer/String, Hadoop IntWritable/Textc)用户提供的 map/reduce 脚本:不管什么语言,利用 stdin...原创 2010-10-27 09:48:47 · 153 阅读 · 0 评论 -
Hive0.5中Partition简述
一、背景1、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。2、分区表指的是在创建表时指定的partition的分区空间。3、如果需要创建有分区的表,需要在create表的时候调用可选参数partitioned by,详见表创建的语法结构。二、技术细节1、一个表可以拥有一个或者多个分区,...原创 2010-10-27 09:49:27 · 188 阅读 · 0 评论 -
Hive-0.5中SerDe概述
一、背景1、当进程在进行远程通信时,彼此可以发送各种类型的数据,无论是什么类型的数据都会以二进制序列的形式在网络上传送。发送方需要把对象转化为字节序列才可在网络上传输,称为对象序列化;接收方则需要把字节序列恢复为对象,称为对象的反序列化。 2、Hive的反序列化是对key/value反序列化成hive table的每个列的值。 3、Hive可以方便的将数据加载到表中而不需要对数据进行转换,这样在处...原创 2010-10-27 09:49:54 · 142 阅读 · 0 评论 -
关于Hive建表需要注意的问题
一、环境1、Hadoop 0.20.22、Hive 0.5.03、JDK 1.64、操作系统:Linux m131 2.6.9-78.8AXS2smp #1 SMP Tue Dec 16 02:42:55 EST 2008 x86_64 x86_64 x86_64 GNU/Linux二、注意事项1、关于数字类型支持的位数类型 支持数字位数tinyint 3位数字smallint 5位数字int 1...原创 2010-10-27 09:50:17 · 591 阅读 · 0 评论 -
Shell脚本执行Hive语句
一、环境1、Hadoop 0.20.22、Hive 0.53、操作系统 Linux m131 2.6.9-78.8AXS2smp #1 SMP Tue Dec 16 02:42:55 EST 2008 x86_64 x86_64 x86_64 GNU/Linux二、步骤1、直接贴上脚本吧#!/bin/bash#give the params: name value tablenameif [ $#...原创 2010-10-27 09:50:41 · 503 阅读 · 0 评论