大数据面试真题_D

原创已于 2025-06-25 16:33:16 修改 · 147 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#大数据 #数据仓库 #面试

于 2025-06-25 16:30:49 首次发布

大数据面试真题合集专栏收录该内容

17 篇文章

订阅专栏

东信时代

技术一面(20min)

自我介绍
会什么开发语言？Java Scala是自学的吗？
GC的算法 ——不太了解只学了JavaEE
Redis为什么这么快？
Hbase的RowKey设计原则
RowKey的读写流程
用Phoenix操作Hbase的时候有没有遇到什么问题？——没答上
Clickhouse的优缺点
MySQL的视图和Clickhouse的物化视图的区别
用Clickhouse查询最大的数据量(行数和字段数)
Flink和SparkStreaming的区别
Flink如何实现精确一致性
有没有做过数据中台？——没有做过但讲了一下我对数据中台的理解
你们部门只负责存数据，其他部门做可视化展示吗？
部门多少人？做大数据多少人？

HR二面(约15min) 风格比较刨根问底

为什么从深圳毕业要去北京工作？现在为什么从北京回来？——回答之后顺着我的回答继续刨根问底了...
看你简历上的每一点写得很有条理性，是否有参考别人的简历？
是否有参加过培训？
什么时候开始做实时项目的？（看着我的简历问的感觉像测试我）
为什么你的简历上的项目的时间都是连贯性的你们公司做完一个项目人员马上投入下一个项目没有交集的吗？
你觉得工作中最大的收获是什么？
能否提供离职证明？
你对我们公司有什么想要了解的吗？——问了下还会不会有三面，答复时间

袋鼠云

一面

interval join不上的数据，怎么处理？怎么做数据修复？
（需要匹配join不上的，用cogroup实现，或者用flinkSQL的左右外关联）
maxwell bootstrap的同时，mysql在变化，怎么保证写到hbase的数据是正确的？
（加读锁，参考flink cdc做法）
flink发生撤回流时，UDF函数失效怎么办，比如级联group下层用上层，就会失效？

滴普科技

一面

hdfs小文件怎么处理？
namenode脑裂怎么处理？
hive有几种join方式？
hive怎么实现行转列
hive的优化
hbase怎么写入的？
hbase中master挂了怎么办？
项目中有做hbase的优化吗？
如何实现kafka端到端数据的一致性（producer->kafka->consumer）？
还有几个问题记不清了

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

走过冬季 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。