- 博客(5)
- 收藏
- 关注
原创 HBASE面试题,希望能够帮助到你
1、HBase是什么?答:hbase是开源的非关系型分布式数据库,拥有高可靠性、高性能、面向列、可伸缩的分布式存储系统2、HBase存储结构?答:3、HBase中rowkey设计原则?答:(1)rowkey长度原则(2)rowkey散列原则(3)rowkey唯一原则4、RowKey如何设计?答:(1)生成随机数、hash、散列值(2)字符串反转5、Hbase的六大特点:答...
2020-04-16 23:44:45
964
原创 简单Hive面试题,希望能够帮到你
1、Hive是什么?答:Hive是建立在 Hadoop 上的数据仓库基础构架。。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。2、Hive的架构?答:3、Hive和数据库比较?答:Hive和数据库除了拥有类似的查询语言,再无类似之处。1.数据存储位置:Hive存储在HDFS。数据库将数据保存在块设备...
2020-04-16 23:23:27
462
原创 17个Flume面试题。希望能够帮到你
1、什么是Flume?答:Flume是Cloudera公司的一款高性能、高可用的分布式日志收集系统,现在已经被Apache收购。2、Flume特点?答:可靠性、可扩展性、可管理性、功能可扩展性、、3、flume组成,Put事物,Task事务?答:Flume组成,Put事物,Task事务a. Taildir Source:断点续传、多目录b. File Channel:数据存储在磁盘中...
2020-04-16 03:53:50
1465
原创 10个Hadoop面试题,希望能够帮到你
1、Hadoop是什么?答: hadoop是一个由Apache基金会所发布的用于大规模集群上的分布式系统并行编程基础框架。目前已经是大数据领域最流行的开发架构。并且已经从HDFS、MapReduce、Hbase三大核心组件成长为一个具有60多个组件构成的庞大生态,可以满足大数据采集、存储、开发、分析、算法、建模等方方面面2、hadoop核心组件是什么?答:HDFS:分布式文件系统,,是一个...
2020-04-16 03:06:46
395
原创 Kafka面试题,附带答案
1.什么是kafka??答: kafka是分布式 · 订阅消息系统,最初由LinkedIn公司开发的,后来被Apache公司收购。kafka是一个分布式、可划分的、冗余备份机制的持久性的日志服务,主要用于流数据2.为什么要使用kafka??答:a.多个生产者b.多个消费者c.基于磁盘的数据存储d.伸缩性e.高性能3.Kafka为什么要使用消息队列??答:A.缓冲和消峰:例:上游突...
2020-04-07 22:47:22
3087
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人