1.转换算子和触发算子的区别,并且分别列举几个
2.groupbykey和reducebykey的区别
首先他们都是要经过shuffle的,groupByKey在方法shuffle之间不会合并原样进行shuffle,。reduceByKey进行shuffle之前会先做合并,这样就减少了shuffle的io传送,所以效率高一点。
3.job和stage是怎么划分的,job是根据什么来定的,stage是根据什么来定的:有几个action就划分几个job
4.类实例化的操作(不要考虑继承,Java的一道题)
5.Linux下怎么查看一个进程,比如MySQL,Tomcat等:用PS命令,也可以和greap结合使用
6.flume中source的来源是什么
7.MapReduce中map的个数是怎么划分的
8.solar技术
给人的总体感觉:
1.拿着创业公司,未来要上市来忽悠人的
2.创始团队来自华为,做网络安全的,其中一个是清华的博士
3.公司13薪,一个月两个周日加班,一周三个周末加班
4.创业3年了,四十多人的团队,最近刚拿到融资
5.在小区里边办公,厨房既是厨房,又是会议室,好不正规
6.深度思考,现在市面上C轮及以上的公司多了,蚂蚁金服就是,并不是每一家公司都是可以上市的,阿里巴巴是因为和孙正义签了协议才上市的。要分清老板的初衷是什么,是注册个公司,接电项目赚点钱的还是真正做事情的。市面上用情怀和梦想忽悠人的多了,还是要看实际一点,到手能有多少钱,能有什么样的一个成长。