
Hive
zj360202
这个作者很懒,什么都没留下…
展开
-
hive外部表和内部表
1.内部表指hive创建并通过load data inpath进数据库的表,这种表可以理解为数据和表结构都保存在一起的数据表。当你通过DROP TABLE table_name 删除元数据中表结构的同时,表中的数据也同样会从hdfs中被删除。CREATE TABLE new_hbase_table(rowkey string, x int, y int) STORED BY 'org.ap原创 2013-02-01 11:24:16 · 2311 阅读 · 0 评论 -
hive udf
有两种方式写UDF一、就是网上比较原创 2014-08-07 19:32:49 · 998 阅读 · 0 评论 -
Hive - hive.groupby.skewindata环境变量与负载均衡
HiveQL 去重操作和SQL一样,HiveQL中同样支持DISTINCT操作,如下示例:(1) SELECT count(DISTINCT uid) FROM log(2) SELECT ip, count(DISTINCT uid) FROM log GROUP BY ip(3) SELECT ip, count(DISTINCT uid, uname) FROMlog G原创 2014-08-07 16:11:51 · 6743 阅读 · 0 评论 -
Hive – Group By 的实现 explain分析
准备数据SELECT uid, SUM(COUNT) FROM logs GROUP BY uid;hive> SELECT * FROM logs;a 苹果 5a 橙子 3a 苹果 2b 烧鸡 1 hive> SELECT uid, SUM(COUNT) FROM logs GROUP BY uid;转载 2014-08-07 16:31:00 · 3209 阅读 · 2 评论 -
hive压缩配置
在代码中加载原创 2014-08-07 16:23:13 · 709 阅读 · 0 评论 -
hive left outer join问题
select * FROM t_xg_product a join t_xg_product_subject_mapping m on (m.product_id=a.product_id)left outer join (select (case when d.product_id is null then '' else cast(d.product_id as string) end原创 2013-08-09 19:03:39 · 906 阅读 · 0 评论 -
hive 外部表不支持添加列
alter table hbase_fct_mcht_item_day add columns(avg_stay_time_bi bigint);会报如下错误:FAILED: Error in metadata: Cannot use ALTER TABLE on a non-native tableFAILED: Execution Error, return code 1 from o原创 2013-04-11 11:07:26 · 2634 阅读 · 0 评论 -
hive expecting Identifier near 'table' in table name 报错
hive> drop table 'fct_pf_vs_hour';FAILED: ParseException line 1:11 mismatched input ''fct_pf_vs_hour'' expecting Identifier near 'table' in table name正常的hql语句执行出问题,解决方法是将 'fct_pf_vs_hour'两边的单引号改成 `f原创 2013-02-20 17:17:18 · 3690 阅读 · 0 评论 -
hive 简单执行完的数据和join完的数据插入到hbase执行结果
上面是join的操作 用时进30s,启了两个job,下面是简单操作平均用时15s多些,这里操作数据时70条,不存在数据量的干扰。原创 2013-02-20 18:28:32 · 616 阅读 · 0 评论 -
hive 创建表和导入数据
1.创建表CREATE TABLE disp_log_data ( ip STRING,time DOUBLE,title STRING,url STRING,hostname STRING,referrer STRING,uvid STRING,isnewvisitor int,scr STRING,spm_pre STRING,spm_url S原创 2013-02-05 14:44:23 · 3071 阅读 · 2 评论 -
hive 执行报beyond physical memory limits
报错内容hive> INSERT OVERWRITE TABLE recommend_user_log_detail_show_old_device PARTITION (dt ='2014-08-08' ) > select /*+ mapjoin(recommend_user_score)*/ c2.udid,c2.ad_id,c2.app_id,'0' as log_type,c原创 2014-08-08 15:43:30 · 8400 阅读 · 0 评论