析源大数据
文章平均质量分 57
睡不着的二进制
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大数据开发入门这么简单?学好这些轻松应对面试!
基础的大数据组件原理和应用最好掌握,数仓知识点肯定要熟悉。若是面向互联网公司,一面大概是基础八股和简历内容,二面主要深挖项目或场景题或底层原理,一面二面都可能涉及数据治理,调优手法相关问题,另外sql和算法也要准备,不过挖底其实套路就那些也还好原创 2025-01-16 13:31:30 · 1016 阅读 · 0 评论 -
Hive SQL必刷练习题:留存率问题
首次登录算作当天新增,第二天也登录了算作一日留存。可以理解为,在10月1号登陆了。在10月2号也登陆了,那这个人就可以算是在1号留存原创 2025-01-15 18:12:53 · 821 阅读 · 0 评论 -
Hive SQL必刷练习题:留存率问题(思路二)
首次登录算作当天新增,第二天也登录了算作一日留存。可以理解为,在10月1号登陆了。在10月2号也登陆了,那这个人就可以算是在1号留存原创 2025-01-15 18:14:39 · 444 阅读 · 0 评论 -
Hive SQL必刷练习题:同一个会话划分问题
如何判断同一个用户,如果连续访问的时间间隔小于60s,就认为是同一个会话,或者说划分到同一个组。原创 2025-01-16 13:14:59 · 423 阅读 · 0 评论 -
Hive SQL必刷练习题:日期交叉问题
问题描述每一行表示一个活动,活动包括起始和终止时间,相邻品牌的两个活动时间可能有重复交叉的情况,现在需求就是去计算每个品牌的总的打折/活动天数原创 2025-01-14 11:04:47 · 484 阅读 · 0 评论 -
Hive SQL必刷练习题:向用户推荐朋友收藏的商品
需要请向所有用户推荐其朋友收藏但是用户自己未收藏的商品,请从好友关系表(friendship_info)和收藏表(favor_info)中查询出应向哪位用户推荐哪些商品。期望结果如下:原创 2025-01-14 10:59:01 · 532 阅读 · 0 评论 -
Hive SQL必刷练习题:排列组合问题
排列组合问题【通过join不等式】原创 2025-01-13 11:52:50 · 366 阅读 · 0 评论 -
Hive SQL必刷练习题:复购率问题
近90天指包含最大日期(以订单详情表(order_detai)中最后的日期)在内的近90天。结果中复购率保留2位小数,并按复购率倒序、商品ID升序排序原创 2025-01-13 11:50:56 · 436 阅读 · 0 评论 -
Hive SQL必刷练习题:同时在线人数问题
现有各直播间的用户访问记录表(live_events)如下,表中每行数据表达的信息为,一个用户何时进入了一个直播间,又在何时离开了该直播间。原创 2025-01-12 16:26:40 · 304 阅读 · 0 评论 -
Hive SQL必刷练习题:连续问题 & 间断连续
1) 连续问题:找出连续三天(或者连续几天的啥啥啥)2) 间断连续:统计各用户连续登录最长天数,间断一天也算连续,比如1、3、4、6也算登陆了6天原创 2025-01-12 16:24:45 · 999 阅读 · 0 评论 -
历史最全大数据开发面试攻略【吐血整理32w+字,260+页】
暑期实习、秋招一路走来,踩过不少坑,比如,刚开始在选择岗位时,明确大数据开发后,迷茫如何学习大数据的时候。太多的组件框架、太多的源码分析、太多的架构和知识点。离线、实时、数据治理、数据倾斜、小文件、内存管理等等,不知道如何下手。还有在找工作的时候,不知道如何做好充分的准备,不知道如何应对面试问答,如何发挥个人正常水平等等问题。接下来我主要介绍大数据开发的学习路线,以及八股文总结相关内容,总的来说就是作为一名数据RD必备的一些技术能力和所需的知识储备。原创 2025-01-11 20:49:27 · 2675 阅读 · 17 评论
分享