
大数据面试题精讲
剑指所有大数据的面试题目
LBJ_小松鼠
这个作者很懒,什么都没留下…
展开
-
Kafka面试题目精讲
1. 请说明什么是Apache Kafka? Apache Kafka是由Apache开发的一种发布订阅消息系统,它是一个分布式的、分区的和重复 的日志服务. 2. 请说明什么是传统的消息传递方法? 传统的消息传递方法包括两种: 排队:在队列中,一组用户可以从服务器中读取消息,每条消息都发送给其中一个人。 发布-订阅:在这个模型中,消息被广播给所有的用户 3. 请说明Kafka相对于传统的消息传递方法有什么优势? 1) 高性能:单一的Kafka代理可以处理成千上万的客户端,每秒处理数兆字节的读写操原创 2021-01-17 10:49:37 · 241 阅读 · 2 评论 -
HBase面试题精讲
1. HBase的特点是什么? 1)大:一个表可以有数十亿行,上百万列; 2)无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态的增加,同一张表中 不同的行可以有截然不同的列; 3)面向列:面向列(族)的存储和权限控制,列(族)独立检索; 4)稀疏:空(null)列并不占用存储空间,表可以设计的非常稀疏; 5)数据多版本:每个单元中的数据可以有多个版本,默认情况下版本号自动分配,是单元格插入 时的时间戳; 6)数据类型单一:Hbase中的数据都是字符串,没有类型。 2. HBase和Hive原创 2021-01-17 10:49:22 · 268 阅读 · 0 评论 -
Hive常见面试题
1.大表join小表产生的问题,怎么解决? 开启MapJoin(解决Reduce时候的数据倾斜). 就是在Map阶段进行表之间的连接。而不需要进入到Reduce阶段才进行连接。这样就 节省了在Shuffle阶段(会跟磁盘打交道)时要进行的大量数据传输。从而起到了优化作业的作用。 2. udf udaf udtf区别 UDF操作作用于单个数据行,并且产生一个数据行作为输出。大多数函数都属于这一类(比如数学函数和字符串函数)。 UDAF 接受多个输入数据行,并产生一个输出数据行。像COUNT和MAX这样的函原创 2020-12-29 18:52:20 · 1820 阅读 · 0 评论 -
JavaSE基础面试题目: 26 - 50
26:转换流当中谁是字节流通向字符流的桥梁? 谁是字符流通向字节流的桥梁? 字节流通向字符流的桥梁: InputStreamReader; 字符流通向字节流的桥梁: OutputStreamWriter; 27:原创 2020-11-19 11:57:59 · 195 阅读 · 1 评论 -
JavaSE基础面试题目1 - 25。
1: 为什么子类的所有构造方法的第一行,都默认有一个super()去访问父类的空参构造? 答:用于子类对象访问父类数据前,对父类数据进行初始化。 2:为啥默认访问的是空参数构造,而不是带参构造? 因为所有类都之间或者间接继承自Object类,Object类中 只有一个空参构造。 ...原创 2020-11-10 20:50:01 · 248 阅读 · 0 评论