美团数据开发面经(一面)
面试部门:零食零售-优选事业部
面试时长:1h20min
以下为面试复盘。
简历部分
我忘记录了,但是就是写在简历上的每一条关于数据开发的都问,且问的很详细。
数仓相关部分
-
你做过那些数仓建设?
-
你们那边数仓的分层分几层?
答:分四层,介绍了每一层的作用。 -
为啥分四层不是分五层或三层?他的分层逻辑是基于什么?
答:根据业务
(打断)业务的什么?
答:业务的需求。我还答了每一层分层对业务的作用和分层的作用。
(打断)我问的不是分层的作用,是为啥要分四层,除了业务需求还有其它的点吗? -
问一下维度建模吧,你先讲一下什么是业务过程?你怎么理解业务过程?
答:有提示吗?
就是什么是粒度,什么是事实,什么是维度?或者换个问法,你觉得我们在做什么事情会用到,会考虑业务过程? -
维度建模会有哪些步骤?你自己在参与数仓建模的时候会有哪些步骤?做一个模型设计会有哪些步骤?
大数据组件部分
-
你接触过什么大数据组件?
答:Hadoop Hive Spark -
Hadoop有几个NameNode,它的职责是什么?
-
Hdfs 读写过程?
-
讲一下Hive架构
-
Hive优化的手段有哪些?
-
Spark 和Mr 相比的优势?
-
你提到了RDD,RDD是什么?
-
你刚说Spark基于内存做计算?如果内存中放不下了怎么办?
答:放磁盘这种物理内存或扩大内存。讲了一下堆外内存和堆内内存。
操作系统
-
你提到了进程线程,进程和线程的区别?
-
并行和并发的区别?
-
什么是死锁?死锁是怎么产生的?
计算机网络
-
Http和Https的区别
-
介绍计算机网络的七层
-
Https属于哪一层?
Mysql
-
三大范式
-
目前索引的数据结构有哪些?
-
讲一下B+树都有哪些特征?
算法题
- 反转链表
- 二叉树的层序遍历
- 求三数之和=0,且三个数不能重复。