
Big Data ------ 面试题
面试大数据岗位
海鸥~
这个作者很懒,什么都没留下…
展开
-
大数据面试题之葵花宝典------Flink高级
葵花宝典------Flink中级1、Flink是如何支持批流一体的?2、Flink是如何做到高效的数据交换的?3、Flink是如何做容错的?4、Flink 分布式快照的原理是什么?5、Flink是如何保证Exactly-once语义的?6、Flink 的 kafka 连接器有什么特别的地方?7、说说 Flink的内存管理是如何做的?8、说说 Flink的序列化如何做的?9、Flink中的Window出现了数据倾斜,你有什么解决办法?10、Flink中在使用聚合函数 GroupBy、Distinct、Key原创 2020-09-09 10:23:34 · 2043 阅读 · 1 评论 -
大数据面试题之葵花宝典------Flink中级
葵花宝典------Flink中级1、Flink是如何支持批流一体的?2、Flink是如何做到高效的数据交换的?3、Flink是如何做容错的?4、Flink 分布式快照的原理是什么?5、Flink是如何保证Exactly-once语义的?6、Flink 的 kafka 连接器有什么特别的地方?7、说说 Flink的内存管理是如何做的?8、说说 Flink的序列化如何做的?9、Flink中的Window出现了数据倾斜,你有什么解决办法?10、Flink中在使用聚合函数 GroupBy、Distinct、Key原创 2020-09-08 17:30:45 · 2172 阅读 · 0 评论 -
大数据面试题之葵花宝典------Flink初级
这里写目录标题1、简单介绍一下 Flink2、Flink相比传统的Spark Streaming区别?3、Flink的组件栈有哪些?4、Flink 的运行必须依赖 Hadoop组件吗?5、你们的Flink集群规模多大?6、Flink的基础编程模型了解吗?7、Flink集群有哪些角色?各自有什么作用?8、说说 Flink 资源管理中 Task Slot 的概念9、说说 Flink 的常用算子?10、说说你知道的Flink分区策略?11、Flink的并行度了解吗?Flink的并行度设置是怎样的?12、Flink原创 2020-09-07 21:36:32 · 2914 阅读 · 0 评论 -
大数据面试题之葵花宝典------flume
葵花宝典------flume1. Flume组成,Put事务,Take事务2. Flume拦截器3. Flume Channel选择器4. Flume监控器5. Flume采集数据会丢失吗?(防止数据丢失的机制)6. Flume内存7. FileChannel优化1. Flume组成,Put事务,Take事务1、Taildir Source:断点续传、多目录。Flume1.6以前需要自己自定义Source记录每次读取文件位置,实现断点续传。2、File Channel:数据存储在磁盘,宕机数据可以原创 2020-09-06 21:25:39 · 3978 阅读 · 0 评论 -
大数据面试题之葵花宝典------Hadoop
葵花宝典------Hadoop1. hdfs读写流程2. hdfs的体系结构3. 一个datanode 宕机,怎么一个流程恢复4. hadoop 的 namenode 宕机,怎么解决5. namenode对元数据的管理6. 元数据的checkpoint7. yarn资源调度流程8. hadoop中combiner和partition的作用9. 用mapreduce怎么处理数据倾斜问题?10. shuffle 阶段,你怎么理解的11. Mapreduce 的 map 数量 和 reduce 数量是由什么决定原创 2020-09-06 01:09:32 · 7695 阅读 · 8 评论