
impala
大师兄你家猴跑啦
主要Java 、spark 、大数据技术
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Impala/Hive UDF编写
一、说明 编写Impala UDF和Hive UDF 其实是一回事;大致分为以下两种添加UDF; (1) 编写Hive的UDF后,登陆impala-shell ,invalidate metadata; (2) 编写impala 的UDF,指定UDF的jar包所在位置和返回值的类型;二、编写hive UDF (按照永久的处理的,但是还是一个session结束后没有了;还是临时的...原创 2018-05-25 15:56:04 · 1187 阅读 · 0 评论 -
Impala row_number()使用
1、需求:找到每个分组中pv最大的第一条数据,取10万条;row_number 格式:ROW_NUMBER() OVER (partition BY COLUMN_A ORDER BY COLUMN_B ASC/DESC) rn其中: rn 是排序的别名执行时每组的编码从1开始 partition by:类似hive的建表,分区的意思;COLUMN_A 是分组字段 ...原创 2018-05-25 16:18:35 · 15573 阅读 · 0 评论 -
Impala安装
一、下载文件(本文选择2.5.0)地址:http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/5.7.0/RPMS/x86_64/二、安装过程1、安装bigtop-jsvc-0.6.0+cdh5.7.0+804-1.cdh5.7.0.p0.78.el6.x86_64.rpm [root@dmp8 impalaRPMs]# rpm...原创 2018-11-21 11:31:16 · 2285 阅读 · 0 评论