
大数据面试指南
犀牛_2046
路漫漫其修远兮,吾将上下而求索!
展开
-
挑战10个最难的Java面试题
这是收集的10个最棘手的Java面试问题列表。这些问题主要来自 Java 核心部分 ,不涉及 Java EE 相关问题。你可能知道这些棘手的 Java 问题的答案,或者觉得这些不足以挑战你的 Java 知识,但这些问题都是容易在各种 Java 面试中被问到的,而且包括我的朋友和同事在内的许多程序员都觉得很难回答。1 为什么等待和通知是在 Object 类而不是 Thread 中声明的?一个...转载 2019-12-02 23:15:18 · 321 阅读 · 0 评论 -
大数据面试题(一)
目录1.Sparkmaster使用zookeeper进行HA的,有哪些元数据保存在Zookeeper?2.SparkmasterHA主从切换过程不会影响集群已有的作业运行,为什么?3.SparkonMesos中,什么是的粗粒度分配,什么是细粒度分配,各自的优点和缺点是什么?4.ApacheSpark有哪些常见的稳定版本,Spark1.6.0的数字分别代表什么意思?...转载 2019-10-09 22:02:24 · 653 阅读 · 0 评论 -
大数据面试题(二)
目录1.cache后面能不能接其他算子,它是不是action操作?2.reduceByKey是不是action?3.数据本地性是在哪个环节确定的?4.RDD的弹性表现在哪几点?5.常规的容错方式有哪几种类型?6.RDD通过Linage(记录数据更新)的方式为何很高效?7.RDD有哪些缺陷?8.Spark有哪些聚合类的算子,我们应该尽量避免什么类型的算子?9....转载 2019-10-09 22:25:38 · 805 阅读 · 0 评论 -
大数据面试题(三)
目录1.Spark使用parquet文件存储格式能带来哪些好处?2.Spark累加器有哪些特点?3.spark hashParitioner的弊端是什么?4.RangePartitioner分区的原理?5.介绍parition和block有什么关联关系?6.Spark应用程序的执行过程是什么?7.hbase预分区个数和spark过程中的reduce个数相同么8.如何...转载 2019-10-09 22:28:40 · 776 阅读 · 0 评论 -
大数据面试题(四)
目录1.MRV1有哪些不足?2.描述Yarn执行一个任务的过程?3.Yarn中的container是由谁负责销毁的,在Hadoop Mapreduce中container可以复用么?4.提交任务时,如何指定Spark Application的运行模式?5. 不启动Spark集群Master和work服务,可不可以运行Spark程序?6.Spark中的4040端口由什么...转载 2019-10-09 22:31:30 · 447 阅读 · 0 评论 -
大数据面试题(五)
目录1、简答说一下hadoop的map-reduce编程模型2、hadoop的TextInputFormat作用是什么,如何自定义实现?3、hadoop和spark的都是并行计算,那么他们有什么相同和区别4、为什么要用flume导入hdfs,hdfs的构架是怎样的5、map-reduce程序运行的时候会有什么比较常见的问题6、简单说一下hadoop和spark的shuffl...转载 2019-10-09 22:34:46 · 254 阅读 · 0 评论