
大数据
文章平均质量分 76
jerry-89
这个作者很懒,什么都没留下…
展开
-
数据清洗总结
原创 2021-04-02 14:01:17 · 1238 阅读 · 0 评论 -
Flink面试通关
概述2019 年是大数据实时计算领域最不平凡的一年,2019 年 1 月阿里巴巴 Blink (内部的 Flink 分支版本)开源,大数据领域一夜间从 Spark 独步天下走向了两强争霸的时代。Flink 因为其天然的流式计算特性以及强大的处理性能成为炙手可热的大数据处理框架。时至今日,Flink 已经发展到 1.9 版本,在大数据开发领域,面试中对于 Flink 的考察已经是大数据开发求职者必须面对的,本文结合自己作为面试官过程中的经验详细总结了近 50 个关于 Flink 的面试考察点。在本转载 2021-03-09 13:13:24 · 289 阅读 · 0 评论 -
Flink学习面试
概念和基础篇1. 简单介绍一下FlinkFlink核心是一个流式的数据流执行引擎,其针对数据流的分布式计算提供了数据分布、数据通信以及容错机制等功能。基于流执行引擎,Flink提供了诸多更高抽象层的API以便用户编写分布式任务:DataSet API, 对静态数据进行批处理操作,将静态数据抽象成分布式的数据集,用户可以方便地使用Flink提供的各种操作符对分布式数据集进行处理,支持Java、Scala和Python。DataStream API,对数据流进行流处理操作,将...转载 2021-03-09 13:10:05 · 316 阅读 · 0 评论 -
Spark面试
场景描述:这是一个Spark的面试题合集。是我自己作为面试者和作为面试官都会被问到或者问到别人的问题,这个总结里面有大量参考了网上和书上各位老师、大佬的一些原文答案,只是希望可以给出更好的回答,一般上我都会把原文链接贴上,如有侵权请联系删除!再次感谢各位提供的资料,如果你有一定的 Spark 基础,但是经常在面试中表现不佳,那么这篇总结应该非常适合你!关键词:Spark 面试题我们直奔主题吧!1. Spark消费 Kafka,分布式的情况下,如何保证消息的顺序?Kafka 分布式的单.转载 2021-03-09 13:07:43 · 2813 阅读 · 0 评论 -
ETL面试
ETL面试题 1. What is a logical data mapping and what does it mean to the ETL team?什么是逻辑数据映射?它对ETL项目组的作用是什么?答:逻辑数据映射(Logical Data Map)用来描述源系统的数据定义、目标数据仓库的模型以及将源系统的数据转换到数据仓库中需要做操作和处理方式的说明文档,通常以表格或Excel的格式保存如下的信息:目标表名: 目标列名: 目标表类型:注明是事实表、维度表或支架维度表。 SC转载 2021-03-09 13:04:10 · 1142 阅读 · 0 评论