目录
- 0-面试题
- 1-答案详细解析
-
- 1.1-自我介绍
- 1.2-到北京工作的医院
- 1.3-SQL题,给一张城市和交易额表,一张城市对应省份表, 取出 省份 总 交易额大于 500 的 省份 的名字
- 1.4-SQL题,基于刚才, 得出 省份 总 交易额 [0,500 ] , [500,1000 ] , [1000,+oo ] 在以下三个区间的 省份 的 数量
- 1.5-SQL题,还是基于刚才, 按从小到大的顺序得出每个城市的累计交易额,可以用窗口
- 1.6-根据分隔符划分字段,可以用正则表达
- 1.7-主要负责的产品
- 1.8-产品的指标如何知道带来多少价值
- 1.9-指标如何做到精准
- 1.10-就项目中提到的某个实体,讲一下他对应的属性有哪些
- 1.11-如果你建模的话,你会如何建模
- 1.12-主要都抽取哪些数据源,使用什么工具
- 1.13-描述一下抽取的内部逻辑,怎么实现的
- 1.14-除了工作,有去读什么书学习吗
- 1.15-你觉得flink和spark streaming有什么区别
- 1.16-Spark Streaming相比Flink有什么优点
- 1.17-有什么想问的嘛
0-面试题
以下为面试过程中提问,岗位为大数据开发,根据提问内容看出,主要偏数仓方向
- 自我介绍
- 到北京工作的意愿
- SQL题,给一张城市和交易额表,一张城市对应省份表, 取出 省份 总 交易额大于 500 的 省份 的名字
- SQL题,基于刚才, 得出 省份 总 交易额 [0,500 ] , [500,1000 ] , [1000,+∞ ] 在以下三个区间的 省份 的 数量
- SQL题,还是基于刚才, 按从小到大的顺序得出每个城市的累计交易额,可以用窗口
- 根据分隔符划分字段,可以用正则表达
- 主要负责的产品
- 产品的指标如何知道带来多少价值
- 指标如何做到精准
- 就项目中提到的某个实体,讲一下他对应的属性有哪些
- 如果你建模的话,你会如何建模
- 主要都抽取哪些数据源,使用什么工具
- 描述一下抽取的内部逻辑,怎么实现的
- 除了工作,有去读什么书学习吗
- 你觉得flink和spark streaming有什么区别
- spark streaming相比flink有什么优点
- 有什么想问的吗
1-答案详细解析
1.1-自我介绍
面试的时候,面试官说的第一句话就是:“介绍一下你自己吧。”
很多人真的很实诚的就只说一句:“我叫xx,来自xx,今年xx岁。”然后双方冷场。
这样的自我介绍还不如前段时间流行的一句话:“我叫xx,我喜欢唱跳、rap、篮球。”起码你还让面试官知道了你的特长。
所以这里就需要你用最短的时间让面试官记住你,突出自己的优势、有论证力的说服对方。
原则如下:不要大段背诵简历内容;不要说流水账,内容冗长;自我介绍时间尽量控制在一分钟左右。
那么怎么在最短时间内满足以上三条。
罗振宇说过:“笨拙的人讲道理,而聪明的人会说故事。”
所以面试时我们要摆脱常规回答,学会“讲故事”。那故事怎么讲,记住以下八个字,将自己的经历或想法套进去:
- 目标:就是我想要做什么,我想要成为什么样的人;
- 阻碍:做这件事的难点是什么,有哪些“质疑”点;
- 努力:为了克服难点和“质疑”,我做了哪些事情;
- 结果:通过我的努力,我现在获得了什么样的成就。
1.2-到北京工作的医院
招人肯定是希望找到一个踏实,稳定的人,而不是那种来了几天或一段时间就走的人。面试官问你这个问题,一是在看你大概能在公司呆多久,二是看公司是否有必要培养你或者录用你。
所以回答时一定要表达出你一定能来北京并且能长时间待下去(即使你不是这样),具体回答发挥个人想象。
1.3-SQL题,给一张城市和交易额表,一张城市对应省份表, 取出 省份 总 交易额大于 500 的 省份 的名字
为了便于理解,根据上面的问题,我们先构造这两张表:
城市交易额表 business_table:
city_num:城市编号
gmv:交易额
city_num gmv
1001 210
1001 90
1002 250
1003 200
1004 700
1005 350
1005 150
1006 250
1007 150
城市对应省份表:province_table:
province_num:省份编号
province_name:省份名称
city_num:城市编号
province_num province_name city_num
11 a 1001
11 a 1005
12 b 1002
12 b 1003
13 c 1004
13 c 1006
13 c 1007
根据以上表,sql 语句如下(以下仅为其中一种写法,仅供参考)
SELECT MAX(tmp.province_name)
FROM (
SELECT bt.city_num, bt.gmv