
面试真经
文章平均质量分 58
进击吧大数据
大数据技术和数仓实操;大数据技术架构手册编制者
展开
-
你知道数据发散和数据倾斜么?
该问题已同步到小程序:全栈面试题问题在数据开发日常工作当中,数据发散和数据倾斜问题是比较常见的。那么我们该如何判断呢?同时该如何规避这两种问题呢?注意:该问题也经常会被面试官拿来提问面试者解答基于以上问题,大佬们给出了如下的回答:数据发散Destiny:对于数据发散问题,可以查看left join关联对应的右表数据是否有重复,如果出现重复的情况,那么就会造成一对多,可能会出现发散情况。致远大佬给出了本质性的解答:数据发散是因为关联字段值不唯一导致的。Nic大佬分享了遇到的数据原创 2022-05-29 19:45:24 · 5350 阅读 · 2 评论 -
一款宝藏面试题平台上线了(再也不用担心找不到面试题了)
当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放 风平浪静 音乐: 陈永淘 - 离开台湾八百米 首先申明:这不是一篇割韭菜的文章。将近有一个多月没有输出文章,因为一直在做一件事:复盘。先跟大家分享一个小故事:在国外有位大学教授曾做过这样一次实验,他当着学生们的面拿出一张10英镑的钱,问学生们有谁想要?...原创 2022-03-29 15:03:44 · 2459 阅读 · 2 评论 -
2020大厂面试题-数仓篇
1、手写sql问题:连续活跃。。。-- 第一种解决方案,使用lag(向前)或者lead(向后)select *from ( select user_id, date_id, lead(date_id) over(partition by user_id order by date_id) as last_date_id from ( select user_id, date_id from wedw_dw.log_转载 2020-09-08 08:11:25 · 5682 阅读 · 2 评论