
hive
文章平均质量分 85
enjoyjin
这个作者很懒,什么都没留下…
展开
-
hive-join优化
hive 连接优化:1、原创 2014-11-18 15:58:15 · 470 阅读 · 0 评论 -
hive学习2-文件格式
hive文件存储格式包括以下几类:1、TEXTFILE2、SEQUENCEFILE3、RCFILE4、ORCFILE(0.11以后出现)其中TEXTFILE为默认格式,建表时不指定默认为这个格式,导入数据时会直接把数据文件拷贝到hdfs上不进行处理;SEQUENCEFILE,RCFILE,ORCFILE格式的表不能直接从本地文件导入数据,数据要先导入到textfil原创 2014-11-18 13:51:57 · 483 阅读 · 0 评论 -
hive学习1-数据类型
在官方的wiki里,example是这样的:Sql代码CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_nam转载 2014-11-18 13:32:00 · 527 阅读 · 0 评论 -
hive学习3-DDL语句
Databases in Hive -- 在HIVE 中使用数据库Hive offers no support for row-level inserts, updates, and deletes.Hive doesn’t support transactions. Hive adds ex-tensions to providebetter performance i转载 2014-11-18 13:57:55 · 988 阅读 · 0 评论 -
hive-DML语句
Loading Data into Managed Tables -- 加载数据到表[sql] view plaincopyprint?LOAD DATA LOCAL INPATH '${env:HOME}/california-employees' OVERWRITE INTO TABLE employees PARTITION (country = 'US',转载 2014-11-18 14:00:52 · 635 阅读 · 0 评论 -
impala,hive行转列
HiveFor Hive, I use collect_set() + concat_ws() from https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF.But if you want to remove duplicated elements, write your own UDF should原创 2014-12-02 21:54:31 · 16578 阅读 · 0 评论