大数据面试真题_D

东信时代

技术一面(20min)

  1. 自我介绍
  2. 会什么开发语言?Java Scala是自学的吗?
  3. GC的算法 ——不太了解 只学了JavaEE
  4. Redis为什么这么快?
  5. Hbase的RowKey设计原则
  6. RowKey的读写流程
  7. 用Phoenix操作Hbase的时候有没有遇到什么问题?——没答上
  8. Clickhouse的优缺点
  9. MySQL的视图和Clickhouse的物化视图的区别
  10. 用Clickhouse查询最大的数据量(行数和字段数)
  11. Flink和SparkStreaming的区别
  12. Flink如何实现精确一致性
  13. 有没有做过数据中台?——没有做过但讲了一下我对数据中台的理解
  14. 你们部门只负责存数据,其他部门做可视化展示吗?
  15. 部门多少人?做大数据多少人?

HR二面(约15min) 风格比较刨根问底

  1. 为什么从深圳毕业要去北京工作?现在为什么从北京回来?——回答之后顺着我的回答继续刨根问底了...
  2. 看你简历上的每一点写得很有条理性,是否有参考别人的简历?
  3. 是否有参加过培训?
  4. 什么时候开始做实时项目的?(看着我的简历问的 感觉像测试我)
  5. 为什么你的简历上的项目的时间都是连贯性的 你们公司做完一个项目人员马上投入下一个项目 没有交集的吗?
  6. 你觉得工作中最大的收获是什么?
  7. 能否提供离职证明?
  8. 你对我们公司有什么想要了解的吗?——问了下还会不会有三面,答复时间

袋鼠云

一面

  1. interval join不上的数据,怎么处理?怎么做数据修复?
    (需要匹配join不上的,用cogroup实现,或者用flinkSQL的左右外关联)
  2. maxwell bootstrap的同时,mysql在变化,怎么保证写到hbase的数据是正确的?
    (加读锁,参考flink cdc做法)
  3. flink发生撤回流时,UDF函数失效怎么办,比如级联group下层用上层,就会失效?

滴普科技

一面

  1. hdfs小文件怎么处理?
  2. namenode脑裂怎么处理?
  3. hive有几种join方式?
  4. hive怎么实现行转列
  5. hive的优化
  6. hbase怎么写入的?
  7. hbase中master挂了怎么办?
  8. 项目中有做hbase的优化吗?
  9. 如何实现kafka端到端数据的一致性(producer->kafka->consumer)?
  10. 还有几个问题记不清了
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

走过冬季

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值