大数据面试真题_S

顺丰

没有问业务

  1. javaJVM的优化
  2. 你了解有哪些算法吗(然后换了个说法,说你了解有哪些排序算法)
  3. 链表结构了解吗
  4. 平衡二叉树了解吗
  5. kafka的ack
  6. kafka怎么保证精准一次消费
  7. kafka支持事务吗
  8. hql熟吗
  9. 内部表和外部表有什么区别,什么时候使用内部表,什么时候使用外部表
  10. 你们在使用hql的时候做了哪些优化
  11. 你们的数据量有多大
  12. 你们有采用分区吗
  13. 你们的分区策略
  14. 分区太多和太少有什么问题
  15. 你跑的最慢的一个查询是多久
  16. 你在写hql的时候有没有做过什么优化
  17. 有没有遇到什么问题
  18. join时数据类型不一致为什么会产生数据倾斜
  19. sqoop参数
  20. sqoop遇到了哪些问题
  21. spark怎么保证数据一致性
  22. spark怎么实现高可用
  23. 你们的数仓搭建原理(还是啥,有点忘了)
  24. hadoop用的哪个版本
  25. hive用的哪个版本
  26. 你有哪些优势
  27. 你们实时用的什么?(只是简单问了下,我回flink就没问了)
    他们要找做离线的,目前没有实时需求
    然后礼貌性的问了下你有什么要问的吗

虾皮shopee

  1. java 的锁了解么?公平锁、非公平锁,偏向锁和非偏向锁?(纳尼?)
  2. volatile关键字了解么?怎么用的?主存是怎么存的?那对应的非主存是怎么处理的?(??)
  3. 说说零拷贝的原理?详细的说下
  4. 计算机原理的一些内容、为什么要分用户态和core?
  5. https的通信机制?怎么建立连接的?(好像是这么问的)
  6. 信息编码的意义?
  7. SQL的预编译的处理的底层原理了解么?
  8. 为什么C/C+ 用来写ClickHouse、redis、Zookeeper这些组件?和java有什么区别?你怎么看待
  9. 说说内部排序算法的时间、空间复杂度和对应的稳定性。(没说全,有点遗忘)
  10. HBase的读流程(原话忘记了,意思是问这个),大表的写入,你们遇到的热点key的场景?怎么解决的?(分区)
  11. redis的缓存击穿、缓存雪崩、缓存失效是什么意思和如何处理?
  12. 布隆过滤器原理和kafka 为什么快这些?
  13. 内部表和外部表的区别?分桶表的原理?一些简单的优化
  14. HQL的处理流程,B+树和LSM的区别?分别讲讲他们的特点?为什么MySQL用B+树,HBase用LSM?
  15. 你们数仓的建模?(对应每层的处理)
  16. 留存率你从ods到ads说下各层都怎么处理获取的?最终的SQL要能用语言表述清除?(建议结合自己的业务)
  17. 如何快速从mysql导数据?离线:sqoop 实时:CDC
  18. kafka 的producer/consumer 可能会出现的问题?丢和重复,怎么避免,怎么解决?
  19. scala的val和var 各自的优缺点?为什么用val?场景设计一堆
  20. scala 常见的集合?(可变和不可变)
  21. scala option的底层原理是怎么设计和实现的有了解吗?
  22. flink的精准一次性,两次事务详细说说
  23. flink对于多个流的join是如何保证同时处理到的?(多个流启动总会有,不能保证流是同时到的,总有流的数据晚到了,怎么保证都能join上)(突然问蒙了,水印?状态?)
  24. 很有其他flink窗口相关的问题,具体的有点忘记了,就是各种异常场景和大状态的问题
  25. 一小时的数据IP,(数据量很大,)怎么得到top10?(只说方案和具体的实现,不敲代码)
    flink有些内容有点没回答好,java相关的JUC和LSM忘记了。

视野数科

  1. IK分词器有几种分词模式
  2. Flink双流join会遇到什么问题是怎么处理的
  3. Flink异步I/o是怎么做的,怎么实现的
  4. Flink介绍开窗函数
  5. 对clickhouse引擎有了解吗
  6. Nginx是怎么配置的
  7. Phoenix对hbase建索引有几种方式及区别
  8. spark 和flink 的checkpoint的区别
  9. spark submit提交任务会用到那些参数
  10. 对于堆内和堆外内存如何了解
  11. udf udtf udaf 函数都有什么区别
  12. 怎么在hive上使用自定义函数
  13. 自定义函数上传的命令是什么
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

走过冬季

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值