储算科技
- 自我介绍
- 说一下实时数仓的搭建过程
- 说一说kafka组件
- kafka组件consumer消费offset存储
- kafka的isr队列
- flume的了解
- spark和flink的区别
- 是否了解数据模型
- go语言写的服务器,使用flume和kafka的方式采集数据,如何优化
橙色魔方-太平保险
问的离线,实时没问
- 自我介绍
- 说一下项目经历
- 数据项目架构(就是想问数据采集那一套)
- sqoop是你自己配的吗(就是那些参数)
- 任务调度用的什么
- java怎么样
- java基本数据类型
- java三大特性
- 有用java在hive里面写过自定义函数吗,udf udtf
- hive架构
- hive常用内置函数
- hive优化
- 最大的一张表
- 你们数据量多大,内存多大,多少台服务器
- 引擎用的什么,为什么用hive on spark,有没有出现什么问题(参数啥的-没答上来,就说兼容性好,没啥问题),
- 还有用其他的吗,对比MapReduce引擎怎么样
- 文件存储格式有了解吗,你们用的什么,为什么用parquet
- 说一下比较难的指标,实现方法
- 为什么离职来深圳
- 薪资要求
3580

被折叠的 条评论
为什么被折叠?



