某大厂大数据开发工程师(偏数据仓库)社招面经

本文记录了一次大数据开发工程师的面试经历,重点讨论了数据仓库的分层思想、cube表、事务性数据库与数据仓库的建表规范、数据倾斜的原理与解决方法、MapReduce实现SQL的过程,以及SQL优化和数据库建模概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

从校招之后两年多以来的第一次面试,悲惨的挂了。记录一下问题和不足吧。

1、问项目,以及你在其中参与的角色,遇到的挑战之类的。

2、继续基于项目发问,因为我之前做的都是离线数据开发,问 怎样保障数据及时准确出具?以及数据质量如何保证?

3、数据仓库分层思想,可以结合自己公司数仓的情况。

ods-dwd/dws-dm,每一层大致介绍一下作用是什么。最后说一下这么分层的好处。

4、有没有听过cube表。

5、事务性数据库和数据仓库在建表时遵循怎样的范式(我说了第一范式的开头,面试官说他要的不是这个…其实是问我这两类数据库的表建表规范有什么不同)

【转载】数据库(范式建模)和数据仓库(维度建模)在设计中的侧重点:

在大部分的数据仓库设计中,一般是不怎么考虑是否满足第几范式的,特别是互联网场景下的数据建设就更少考虑数据仓库和范式之间的关系。

数据库(OLTP)的设计,主要是基本的、日常的事务处理,例如银行交易。直白点讲,就是各种增删改查,需要对数据进行操作。而数据仓库(OLAP),主要是面向日常数据分析,它的数据主要是插入和查询,基本不涉及删除和

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值