
hive
大霖技术进阶
Keep Study,Keep Coding
展开
-
Hive分析窗口函数(一) NTILE,ROW_NUMBER,RANK,DENSE_RANK -
Hive分析窗口函数(一) NTILE,ROW_NUMBER,RANK,DENSE_RANK数据准备cookie1,2018-04-10,1cookie1,2018-04-11,5cookie1,2018-04-12,7cookie1,2018-04-13,3cookie1,2018-04-14,2cookie1,2018-04-15,4cookie1,2018-04-16,4cookie2,2018-04-10,2cookie2,2018-04-11,3cookie2,2018-原创 2021-04-28 11:40:57 · 231 阅读 · 0 评论 -
大数据流量分析查用指标介绍
**流量分析常见分类**指标是网站分析的基础,用来记录和衡量访问者在网站自的各种行为。比如我们经常说的流量就是一个网站指标,它是用来衡量网站获得的访问量。在进行流量分析之前,我们先来了解一些常见的指标。1. 基础级指标PageView浏览次数(PV):用户每打开1个网站页面,记录1个PV。用户多次打开同一页面PV累计多次。通俗解释就是页面被加载的总次数。Unique Visitor独立访客(UV): 1天之内,访问网站的不重复用户数(以浏览器cookie为依据),一天内同一访客多次访问网站只被计算原创 2021-04-27 17:50:01 · 1033 阅读 · 0 评论 -
HIVE中lateral view 与 explode函数使用
UDTF(User-Defined Table-Generating Functions) 用来解决输入一行输出多行(On-to-many maping) 的需求。Explode也是拆列函数,比如Explode (ARRAY) ,array中的每个元素生成一行。**explode的使用**001,allen,usa|china|japan,1|3|6002,kobe,usa|england|japan,2|3|4创建表create table test_message(id int, name原创 2021-04-27 15:41:28 · 1272 阅读 · 0 评论 -
hive自定函数 UDF使用
1. Hive 自带了一些函数,比如:max/min等,当Hive提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数(UDF).2. 根据用户自定义函数类别分为以下三种: 1. UDF(User-Defined-Function) - 一进一出 2. UDAF(User-Defined Aggregation Function) - 聚集函数,多进一出 - 类似于:`count`/`max`/`min` 3. UDTF(Us原创 2021-04-24 11:00:52 · 359 阅读 · 0 评论