
hive
akon_vm
这个作者很懒,什么都没留下…
展开
-
Hive insert into话语用法
Hive insert into语句用法 在Hive0.8开始支持Insert into语句,它的作用是在一个表格里面追加数据。标准语法语法如下:123456789用法一:INSERT OVERWRITE TABLE tablename1 [PARTITIO转载 2014-07-15 20:57:26 · 19630 阅读 · 0 评论 -
hive分区(partition)简介
网上有篇关于hive的partition的使用讲解的比较好,转载了:一、背景1、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。2、分区表指的是在创建表时指定的partition的分区空间。3、如果需要创建有分区的表,需要在create表的时候调用可选参数转载 2014-07-15 21:37:55 · 29095 阅读 · 1 评论 -
hive中的静态分区与动态分区
hive中创建分区表没有什么复杂的分区类型(范围分区、列表分区、hash分区、混合分区等)。分区列也不是表中的一个实际的字段,而是一个或者多个伪列。意思是说在表的数据文件中实际上并不保存分区列的信息与数据。下面的语句创建了一个简单的分区表:create table partition_test(member_id string,name string)partition转载 2014-07-15 21:52:17 · 1317 阅读 · 0 评论 -
Hive限制
1.更新,事务,索引,不支持,是全表扫描2.创建表的字段类型和java类型是对应的。不支持日期类型,提供转换为字符串类型的函数。3.查询语句中,不支持having,可写嵌套的select来解决;group by后只能是表的定义列名,不能像mysql那样可以为查询语句为逻辑处理结果声明的别名,但可为逻辑处理过程语句4.内置函数查看命令(show functions;des转载 2014-07-29 16:09:46 · 2231 阅读 · 0 评论 -
hive SQL优化之distribute by和sort by
最近在优化hiveSQL,下面是一段排序,分组后取每组第一行记录的SQLINSERT OVERWRITE TABLE t_wa_funnel_distinct_temp PARTITION (pt='${SRCTIME}') SELECT bussiness_id, cookie_id, session_id, funnel_id, group_转载 2014-08-05 15:41:45 · 1334 阅读 · 0 评论 -
hive QL 插入语法
1.insert 语法格式为:基本的插入语法:INSERT OVERWRITE TABLE tablename [PARTITON(partcol1=val1,partclo2=val2)]select_statement FROM from_statementinsert overwrite table test_insert select * from test_table;转载 2014-07-15 20:42:53 · 1190 阅读 · 0 评论