数仓面试总结

原创已于 2022-06-01 20:29:40 修改 · 4.3k 阅读

61 ·

CC 4.0 BY-SA版权

文章标签：

#大数据 #面试 #数据仓库

于 2021-07-08 16:55:12 首次发布

个人总结专栏收录该内容

10 篇文章

订阅专栏

博主分享了自己在2021年5月至7月间面试多家公司的经历，包括字节跳动、运满满、拼多多、美团、PayPal、波克城市和叮咚买菜等。面试内容涉及数仓分层、MapReduce、Flink、数据质量控制等大数据相关技术，同时也提到了面试准备、个人技能短板及面试官对技术理解的要求。博主意识到代码能力、面试准备及底层技术掌握的重要性，并对面试过程进行了反思。

2021年5月开始找工作，面试了若干个数仓的岗位，面的差不多也就2个，总结下大致的面试内容

一、字节视频面，上海的一个部门，视频面挂，小伙伴内推的
   这个5月份面的，大概视频面试了一个小时，主要面试内容
   1、问了mapreduce的具体执行过程，这位面试官还问到了执行计划的东西，就是explain sql代码的东西，这个我基本都不会
   2、数仓分层的东西，就大致讲了下分几层还有主题的划分
   3、因为我现在做了一些flink的东西，问了一点流的东西
   4、做了1个sql的题目，相互关注的2个用户怎么找出来

结果：我小伙伴帮忙问了下，说我的数仓知识和技术都薄弱，就这样了

二、运满满，还行，小伙伴内推的
   5月20几号面的，面了3轮，数仓、数据开发部门leader，数据部门leader
   1、基本讲下数据怎么分层，指标库怎么做的，数据质量怎么做的
   2、第二轮就稍微问下数仓的工作，几分钟就过完了
   3、第三轮是视频面的，大致讲下数据方面的看法之类的，这个leader我觉得思想还是高一个层次的

三、拼多多，视频面挂
   这个面试体验很不好，可能面试我的是个大佬，就是大家的思路好像不在一条线上
   1、先问了下之前数分的工作做了啥，然后讲下之前数分的项目，我就大致说了下，然后说我:应该说下你是什么角色，具体做了什么事，有哪些可以改进的点等等；我是很懵逼的
   2、做几道sql的题目，具体的忘了
   3、然后接着说mapreduce的东西，就问，map是怎么个执行方式，reduce是怎么执行的
   4、还问了flink的东西，底层嘛肯定是不怎么了解的
   5、最后给我一通教育

四、美团，视频面挂
    1、讲下mapreduce的具体执行过程，这个sql select a,count(distinct b) from table1 group by a在mapreduce上是怎么执行的
    2、看我不怎么会出了个sql题目，连续登陆的用户取出来，这个题目之前还写过，紧张了还写错了---解题
    3、还问了，知道什么olap的引擎，怎么调优之类的，这个我感觉是大数据开发的东西应该

五、paypal，小伙伴内推的，视频面挂
1、讲下我们这边具体做啥
2、问了一个代码的题目，怎么从数组中拿出来最大值，就是简单循环，我也是写的稀烂；一个sql的题目

结果：这个其实工作内容差别还是有的，我理解他们是没有数仓概念的，应该是只做dw层清洗工作

六、波克城市，小伙伴内推的，面了2轮，没后续了
1、简单自我介绍，具体做啥，日常维护多少任务，计算量多少之类的
2、leader面，具体讲下都做啥，用的啥组件

结果：这个我觉得回答的还好，不过他们其实是没有数仓概念的，东西都是在mysql上搞的，最后也没要我

七、叮咚买菜，小伙伴内推的，面了4轮，过了

1、做了面试题，有3道，4个题目

       第一题考察行转列
       第二题考察连续登陆，就搞个row_number排序减一下
       第三题简单

2、数仓面试，自我介绍，问了些简历上写的东西，还有问了数据质量怎么把握的，数据分了几层，各层都放啥东西，还有你认为数据工作最重要的是啥，写过啥udf，没问mapreduce的东西

3、数仓的leader应该，问的很细，简历上的东西挨着问，之前数分写的东西都在问，这里还说到我数分的工作看起来好像不专业，比如专业术语也没有，python也不用，我还解释说基本没见到互联网公司有用python做数分的；
问的东西也大差不差，问了下编程语言用啥，我就说都是抄包的东西，底层不会，问了工作方向

4、上一个又找了做埋点的同学又问了点埋点方案啥的，就讲下埋点怎么埋的之类的，数据流程是什么样子的

5、这个应该是数据部门的老大，也问了一堆埋点的东西和之后的个人规划

结果：说是面试过了，谈薪资

总结：
   1、代码还是重要的，不管是java，scala，python，还是要写的，虽然日常工作不怎么用
   2、面试还是要准备，我是头铁，没有专门针对，mapreduce这个东西问了好几次也没认真看
   3、面试也是主观的印象，都是个人适应公司，且很多面试都是会问自己知道的东西，个人多调整心态
   4、大数据东西是真的多，要做到精通，底层还是要学习的，希望都能当上大佬