
HIVE
文章平均质量分 61
zhyjtwgsnwxhn
这个作者很懒,什么都没留下…
展开
-
Hive之insert into 和insert overwrite
insert into 和overwrite的用法:INSERT INTO TABLE tablename1 [PARTITION \(partcol1=val1, partcol2=val2 ...)] \select_statement1 FROM from_statement;INSERT OVERWRITE TABLE tablename1 [PARTITION \(part转载 2015-11-23 10:25:52 · 683 阅读 · 0 评论 -
HiveQL操作简要 数据库和表的相关
--01建数据库CREATE DATABASE IF NOT EXISTS DATABASE_NAME;--02查询数据库SHOW DATABASE;SHOW DATABASE LIKE 'h.*'--Hive 并非支持所有的正则表达式功能--03 修改数据库默认位置CREATE DATABASE DATABASE_NAME LOCATION '/my/preferred/原创 2015-11-17 18:11:43 · 1031 阅读 · 0 评论 -
HIVE 小技巧
1.hive 从虚拟表查询多行记录。在初始化特定数据的时候,可以作为一个子查询表做关联动作。SELECT explode(ARRAY(1,2,3)) FROM dual;2.hive 的join 的优化在关联表的时候,为了让查询更有效率,我们应该保证连续的查询的表的大小从左往右是依次增加的,使用了/*+STREAMTABLE(S)*/ 将直接告诉查询优化器那张表是大表,S表就是大表原创 2015-11-23 17:14:24 · 552 阅读 · 0 评论 -
Hive编程指南 读书笔记
Hadoop生态系统是为了处理大数据集而产生的一个合乎成本效益的剞劂方案。Hadoop实现了一个特别的计算模型也就是MapReduce ,它可以将计算任务分割成多个处理单元然后反三刀一群家用的或是服务器级别的硬件机器上,从而降低成本并提供了平台可以伸缩性。这个计算模型的下面是一个被称为HDFS的hadoop分布式文件系统。这个系统是可插拔的。HIVE出现的原因就是,用户需要这样一个工具去把现有原创 2015-12-18 11:05:47 · 611 阅读 · 0 评论 -
hive 开发疑问
1.分区表怎么建立?Create [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_name data_type [COMMENT col_comment], ..原创 2016-02-01 14:52:45 · 414 阅读 · 0 评论 -
Hive Operators and User-Defined Functions (UDFs)
LanguageManual UDFSkip to end of metadataCreated by Confluence Administrator, last modified by Carl Steinbach on Dec 13, 2015Go to start of metadataHive转载 2016-02-21 08:56:47 · 896 阅读 · 0 评论