博奥特
招全栈,需要会java,大数据两个技术面试官
- 最近一次项目
- 工作职责(我老是以用户日活举例,让我用别的举例)
- flume有遇到什么问题吗(他说会数据丢失)
- kafka有遇到什么问题吗
- kafka 偏移量保存
(我说kafka会自己建立一个__consume_offset的topic保存偏移量,他说让我去看清楚
我就说0.9之前保存在zookeeper,0.9后保存在自己建的一个topic中,不知道是不是诈我) - kafka副本同步机制,leader的副本怎么同步
- kafka leader选举
- 实时数仓搭建中你做了什么
- 集群规模有多大,多少核多少内存
- 采集,离线和实时都在同一个集群跑吗
- flink几个任务,集群能扛得住吗
- 跑flink任务用的什么模式
- 提交参数设置了哪些,为什么这样设置
- 测试和生产是在同一个集群中吗
- 数据量有多大
- 数据量这么少为什么做大数据平台
- kafka怎么确保一致性的
- 为什么使用flink而不是spark streaming
- flink保证数据一致性
- 说说flink你做的哪些
- 数据哪来的(我说日志数据使用flume导入到kafka,业务使用maxwell同步)
- maxwell使用过程有什么问题吗
- 为什么不适用flinck cdc
- 处理过表的join吗
- hive有进行分区分桶吗
- 说说分区和分桶
- 有遇到过数据倾斜吗,产生的原因,怎么解决
- 数据量这么小,(我说我们是按照日期进行分区的)考虑过 小文件的问题吗
- 日期的话怎么获取表的新增数据(变化数据)
- 那不会产生时间漂移吗(我说我们的时间是在用户触发时,前端传递给后端的)
- 窗口函数了解吗
- 有使用自定义函数吗,需要实现哪个类,重写哪些方法
- 如何获取json字符串数据
- 有进行过优化吗,
- 熟悉java吗
- set去重原理
- 线程和多线程了解吗
- 进程和线程的生命周期有哪些
- 了解jvm吗
- 说说jvm中的组成及作用
- 考虑做全栈开发吗
3万+

被折叠的 条评论
为什么被折叠?



