
hive
lazy-code
其实我们在意的并不是自己有多好,而是自己比别人好多少...
展开
-
hive 建表例子
1.creating hive tableshive>create table pokes (foo int,bar string);creates a table called pokes with two columns,the first being an integer and the other a stringload dataload inpath ""原创 2015-11-03 23:28:46 · 681 阅读 · 0 评论 -
Hive 不同文件读取对比
1.hive的读取方式2.各个方式的例子的对比读取方式:1. stored as textfile1.1 直接查看hdfs1.2 hadoop fs -text2.stored as sequencefile2.1 hadoop fs -text3.stored as rcfile3.1 hive -service rcfilecat path4.store原创 2015-11-20 22:15:47 · 1213 阅读 · 1 评论 -
hive 建表
hive建表是学习hive的第一步,建表很容易,但建个适合自己的就不是那么容易了,建表语句也有很大的学问。1.建表语句:create [external] table [if not exists ] table_name[(col_name data_type [comment col_comment], ...)] [comment table_comment] [partitio转载 2015-11-02 22:47:51 · 621 阅读 · 0 评论 -
hive 分桶
1.何为分桶以及和分区的区别2.实际例子分桶:如果我们根据某列进行分桶,意思就是对这列的值进行hash,然后除以桶的个数再决定把这个值放到哪个桶中,当我们查询数据的时候,where 分桶列=“” 首先也会对这个条件的值进行hash,找到他所在的桶,这样的话 其他桶就不会再找避免暴力扫描,速度上也会提升和分区区别:分区是增加实际目录,每增加一个分区就会多个目录,分桶时把一个大的文原创 2015-11-21 16:38:13 · 984 阅读 · 0 评论 -
hive 动态分区
1.动态分区参数介绍2.实际例子几个参数:set hive.exec.dynamic.partition=true//使用动态分区set hive.exec.dynamic.partition.mode=nonstrick;//无限制模式如果模式是strick,则必须有一个静态分区,且放在最前面,就是第一个分区先给他指定好set hive.exec.max.dynamic.原创 2015-11-21 18:17:27 · 610 阅读 · 0 评论 -
分区、桶、Sort Merge Bucket Join
目录[-]1、Hive 分区表1.1 实现细节1.2 语法2、Hive 桶1. 创建带桶的 table :2. 强制多个 reduce 进行输出:3. 往表中插入数据:4. 查看表的结构:5. 读取数据,看每一个文件的数据:6. 对桶中的数据进行采样:7. 查询一半返回的桶数:3、举个完整的小栗子:(1)建student & studen转载 2015-11-08 11:29:26 · 470 阅读 · 0 评论 -
hive UDF操作
创建java类(导入对应的依赖包):public classHiveHello extendsUDF { public Text evaluate(Text in){ Stringresult="helloWorld"+in; returnnew Text(result); }}打成jar:hive> add jar /scr原创 2015-11-07 19:12:36 · 457 阅读 · 0 评论 -
hive 分区
hive 分区:1、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。2、分区表指的是在创建表时指定的partition的分区空间。3、如果需要创建有分区的表,需要在create表的时候调用可选参数partitioned by,详见表创建的语法结构。创建分区原创 2015-11-06 23:17:50 · 741 阅读 · 0 评论 -
hive 导入导出数据
1.创建练习所需表(外部表)hive> create external table export_test(id int,context string) row format delimited fields terminated by ' ' stored as textfile;2.在本地创建练习数据[root@hadoop02 hive]# touch export_data原创 2015-11-07 16:27:41 · 486 阅读 · 0 评论 -
hive 学习笔记(一)
Hive只在一个节点上安装即可1.上传tar包2.解压tar -zxvf hive-0.9.0.tar.gz -C /cloud/3.配置mysql metastore(切换到root用户)配置HIVE_HOME环境变量rpm -qa | grep mysqlrpm -e mysql-libs-5.1.66-2.el6_3.i686 --nodeps原创 2015-10-21 11:04:55 · 383 阅读 · 0 评论 -
hive join
1.join表连接:(1) 两个表m,n之间按照on条件连接,m中的一条记录和n中的一条记录组成一条新记录(2)join 等值连接,只有某个值在m和n中同时存在时(3)left outer join 左外连接,左边表中的值无论是否在右表中存在时,都输出,右边表中的值只有在左边表中存在时才输出(4)right outer join 和left outer join 相反(5)原创 2015-11-24 23:22:50 · 396 阅读 · 0 评论