
hive
安伦_Alan
随身笔记
展开
-
HIVE 调优方法大全
Hive是目前应用最多最广的SQL on Hadoop工具,近期很多专业的大数据公司推出了很多新的,基于列式或者内存热数据的SQL工具,像Impala,Tez,Spark等等,但是Hive仍然是目前使用率最高和普及面最广的SQL on Hadoop的工具。在以前淘宝罗李的报告中,淘宝90%的业务跑在Hive上面。暴风影音的比例更高一些,大概95%以上都是跑在Hive上面。尽管很多人对Hive有看法转载 2015-10-16 16:29:24 · 1974 阅读 · 0 评论 -
hive中order by,sort by, distribute by, cluster by作用以及用法
====================================marked by Alan at 2015-10-15 13:52=========================================1. order by Hive中的order by跟传统的sql语言中的order by作用是一样的,会对查询的结果做一次全局排序,所以说,只有h转载 2015-10-16 13:53:00 · 425 阅读 · 0 评论 -
hive配置文件详解
hive.exec.mode.local.auto 决定 Hive 是否应该自动地根据输入文件大小,在本地运行(在GateWay运行) true hive.exec.mode.local.auto.inputbytes.max 如果 hive.exec.mode.local.auto 为 true,当输入文件大小小于此阈值时可以自动在本地模式运行,默认是 128兆。转载 2015-11-05 10:57:25 · 2044 阅读 · 0 评论 -
HIVE函数
1、日期函数返回值类型 名称 描述 string from_unixtime(int unixtime) 将时间戳(unix epoch秒数)转换为日期时间字符串,例如from_unixtime(0)="1970-01-01 00:00:00" bigint unix_tim原创 2015-10-09 11:08:57 · 539 阅读 · 0 评论 -
Hive sql语法详解
Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL 去查询分析需要的内容,这套SQL 简称Hive SQL,使不熟悉mapreduce 的用户很方便的利用SQL 语言转载 2015-10-15 14:15:49 · 522 阅读 · 0 评论