hive
kent7306
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hive UDF开发指南
编写Apache Hive用户自定义函数(UDF)有两个不同的接口,一个非常简单,另一个...就相对复杂点。翻译 2015-12-11 11:59:46 · 8587 阅读 · 3 评论 -
Hive UDTF开发指南
在这篇文章中,我们将深入了解用户定义表函数(UDTF),该函数的实现是通过继承org.apache.hadoop.hive.ql.udf.generic.GenericUDTF这个抽象通用类,UDTF相对UDF更为复杂,但是通过它,我们读入一个数据域,输出多行多列,而UDF只能输出单行单列翻译 2015-12-07 00:21:40 · 11383 阅读 · 2 评论 -
hive权限管理之实践
一、实践心得领导说公司集群的hive要进行权限管理,然后身为底层码农的我就开始找资料进行配置实践,关于这方面的资料也不少,主要参考这个连接,里面说得也挺详细的。http://www.aboutyun.com/thread-12549-1-1.html总结如下:1、若赋予用户某个表的权限,查用户在该表所属数据库的权限,是查询不出来的,要指定到那张表2、若要赋予用户db1数据库原创 2015-10-30 16:33:24 · 8202 阅读 · 0 评论 -
Hive 分析函数lead、lag实例应用
Hive的分析函数又叫窗口函数,在oracle中就有这样的分析函数,主要用来做数据统计分析的。Lag和Lead分析函数可以在同一次查询中取出同一字段的前N行的数据(Lag)和后N行的数据(Lead)作为独立的列。这种操作可以代替表的自联接,并且LAG和LEAD有更高的效率,其中over()表示当前查询的结果集对象,括号里面的语句则表示对这个结果集进行处理。原创 2015-12-31 15:34:21 · 69898 阅读 · 6 评论 -
Hive UDAF开发详解
说明这篇文章是来自Hadoop Hive UDAF Tutorial - Extending Hive with Aggregation Functions:的不严格翻译,因为翻译的文章示例写得比较通俗易懂,此外,我把自己对于Hive的UDAF理解穿插到文章里面。udfa是hive中用户自定义的聚集函数,hive内置UDAF函数包括有sum()与count(),UDAF实现有简单与通用翻译 2015-11-30 11:36:29 · 24502 阅读 · 3 评论 -
基于phoenix的用户清单查询
在没有分布式Nosql数据库之前,移动、电信用户扣费清单查询、通话清单查询,是一件很头疼的事情。而hbase提供了海量数据的毫秒级查询。可见,hbase是个非常好的实时查询框架,缺点就是查询功能非常薄弱,仅限于通过行键查询,而phoenix是构建于hbase之上的,提供了HBase的sql访问功能,可以使用标准的JDBC API操作去创建表、插入记录、查询数据。因此容易让开发人员上手、简化开发流程。原创 2016-04-19 16:52:25 · 1836 阅读 · 2 评论 -
hive中的distribute by, order by, sort by简述
hive的一些心得记录原创 2016-09-28 11:39:03 · 1797 阅读 · 0 评论
分享