大数据面试真题_H

华秋电子

一面

  1. 你住在哪里,你女朋友在哪块上班?想半天,直接暴露
  2. 你们公司几台节点,开发多少人,部门多少人,
  3. 有做元数据管理吗,
  4. 集群规模,集群用的什么版本,集群角色怎么分布的?
  5. 你有参与技术选型是吧,举个例子?
  6. 在公司里你主要是做什么?
  7. Azkaban挂过吗? 他说他们经常挂 每天数据量多大?
  8. 你们用sqoop从数据从hdfs导到mysql没有问题吗?
  9. 你们mysql用的是集群吗?
  10. 你在项目中做了些什么?
  11. 说两个你分析过的指标 flink-cdc2.0有什么新特性?
  12. clickhouse数据存储方式,你们用的是集群吗?
  13. kafka怎么保证分区有序?
  14. 你们实时项目没有使用flinksql?

华胜天成

一面

这家公司做的银行的项目,只做离线

  1. 自我介绍
  2. 介绍一下你简历上的项目(我简历上写的离线和实时,都介绍了)
  3. 离线项目里写过的sql
  4. 问了些sql的问题
  5. 写过shell脚本吗,举例几个
  6. linux的一些命令(我这老运维,你要聊这个我可不困了啊)
  7. 听他吹牛逼扯淡
  8. 离职原因
  9. 离职前薪资,期望薪资

华为

一面

电话面试

  1. 你们的业务是什么?
  2. 你最近的项目是什么是用flink吗?
  3. 你能给我讲讲你处理过最难的指标吗?并且该指标的作用是什么?
  4. 你说你使用过分流,那么你给我讲讲是怎么分流的吗?
  5. 你做分流的时候,用到了什么算子。
  6. 使用过phoniex,有一个场景(我不太记得了他具体说的啥),可能会导致phoniex 查询不到hbase的数据,请问你遇到过吗?并且怎么处理的?
  7. 你能讲讲JDBC连接的整体流程吗 ,以select为例,并且关闭顺序是什么。
  8. 你给我讲讲你们的业务吧,可以细讲一些指标吗?
  9. ArrayList 和 LinkList 的区别?
  10. 你使用过SpringBoot,你给我讲讲业务场景(数据采集)
  11. 你还说用到了微服务(多嘴了),你给我讲讲他怎么的一些组件。
  12. 你们公司微服务有多少个?。
  13. 前端埋点,你给我讲讲,你扮演了什么角色。

欢忻网络

一面

  1. 面试官先介绍了下他们公司,主做游戏业务
  2. 自我介绍
  3. 讲一下你们的项目
  4. 讲一下Flink的分区策略,什么情况下要使用什么分区?
  5. Flink的JM和TM的作用
  6. Flink的提交流程
  7. Flink的数据抽象
  8. FlinkSql的执行和转化流程
  9. Flink状态后端,精确一次
  10. Flink的checkpoint,详细讲讲
  11. 重启策略
  12. 反压机制,如何处理
  13. keyBy等算子数据出现热点问题,如何解决
  14. 开始怼Kafka
  15. kafka如何保证数据不丢,不重
  16. kafka组件间一致性的协议(好像是这么个问题,记不清了)
  17. 你还熟悉hive是吧,那跟我讲一下hive sql的执行流程,转化流程,结果的获取(我:?)

禾渤科技(上海)

一面

  1. 往Redis缓存维度数据和删除维度数据有做读写分离吗?
    我回答没有,redis集群不是主机负责写,从机负责读吗
  2. Java/Scala手写WordCount
  3. 手写SQL实现当天,最近3天,最近7天的订单总数,付款总数,退款总数
  4. HBase高可用怎么做的
  5. Zookeeper选举机制
  6. Flume的结构

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

走过冬季

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值