你们公司的数仓是怎么搭建的
你们是怎么解决缓慢变化维的问题?
拉链表
如何在分组内排序,不能使用开窗函数
Spark的调优
Olap的两种分类
讲一下你精准推荐用到的算法,以及他们的原理
如果你们公司的技术选型满足不了需求是怎么处理的
你们公司的集群有多大,服务器的配置,各种数据有多大,Container的并发多大,Kafka有多少台
Mysql事务隔离级别
当程序在并发跑的时候,有一个节点出问题了,数据会跑不出来还是跑出来有丢失,怎么解决的
hadoop和Spark的区别,各有什么优缺点
你们是如何保证数据的安全性,如何保证数据质量
ClickHouse有什么引擎,有什么区别,你们用的是什么引擎
什么是隐式函数
Scala和java的区别
讲一下Spark的rdd